চীনা গবেষকদের একটি সাম্প্রতিক গবেষণায় দেখা গেছে যে মাল্টিমোডাল ল্যাঙ্গুয়েজ মডেল (এলএলএম) মানুষের মতো বস্তুর ধারণাগত উপস্থাপনাগুলি স্বতঃস্ফূর্তভাবে তৈরি করতে পারে।
গবেষকরা কুকুর, চেয়ার, আপেল এবং গাড়ির মতো ১,৮৫৪টি বিভিন্ন বস্তু সম্পর্কে এআই দ্বারা তৈরি প্রায় ৪.৭ মিলিয়ন প্রতিক্রিয়া বিশ্লেষণ করেছেন। গবেষণায় অন্তর্ভুক্ত মডেলগুলির মধ্যে ছিল ChatGPT-3.5, যা শুধুমাত্র টেক্সটের উপর কাজ করে এবং Gemini Pro Vision, একটি মাল্টিমোডাল মডেল যা ছবি এবং টেক্সট উভয়ই প্রক্রিয়া করতে সক্ষম।
ফলাফলগুলি দেখিয়েছে যে এই এআইগুলি এই বস্তুগুলিকে ৬৬টি ধারণাগত মাত্রায় সংগঠিত করেছে, যা 'খাবার' বা 'আসবাবপত্র'-এর মতো সাধারণ ক্লাসিক বিভাগগুলির চেয়ে অনেক বেশি। এই মাত্রাগুলির মধ্যে রয়েছে টেক্সচার, মানসিক প্রাসঙ্গিকতা, বা শিশুদের জন্য উপযুক্ততার মতো সূক্ষ্ম বৈশিষ্ট্য। অন্য কথায়, এই এআইগুলি একটি জটিল মানসিক মানচিত্র তৈরি করছে বলে মনে হচ্ছে, যেখানে বস্তুগুলিকে যান্ত্রিকভাবে সাজানো হয় না, বরং জটিল মানদণ্ড অনুসারে শ্রেণীবদ্ধ করা হয় যা আমাদের মস্তিষ্ক কীভাবে আমাদের চারপাশের জগৎকে সাজায় তার অনুরূপ।
গবেষণাটি এআই মডেল এবং মানব মস্তিষ্ক কীভাবে একই বস্তুর প্রতি প্রতিক্রিয়া জানায় তাও তুলনা করেছে। ফলাফলগুলি দেখিয়েছে যে মস্তিষ্কের কার্যকলাপের কিছু নির্দিষ্ট এলাকা বস্তুর বিষয়ে এআই-এর 'ধারণা'-এর সাথে মিলে যায়। এই মিল মাল্টিমোডাল মডেলগুলিতে আরও বেশি সুস্পষ্ট, যা ভিজ্যুয়াল এবং শব্দার্থিক প্রক্রিয়াকরণকে একত্রিত করে, এইভাবে মানুষ কীভাবে তাদের পরিবেশকে বুঝতে ইন্দ্রিয়গুলিকে একত্রিত করে তার অনুকরণ করে।
তবে, এটা মনে রাখা গুরুত্বপূর্ণ যে এই এআইগুলির সংবেদনশীল বা মানসিক অভিজ্ঞতা নেই। তাদের 'বোঝা' ডেটার পরিসংখ্যানগত প্রক্রিয়াকরণের ফল, যেখানে তারা জটিল নিদর্শনগুলি সনাক্ত করে এবং পুনরুৎপাদন করে, তারা যা বর্ণনা করে তা অনুভব না করেই। এটি পরিশীলিত স্বীকৃতি এবং সত্যিকারের সচেতন অনুভূতির মধ্যেকার সম্পূর্ণ সূক্ষ্মতা।
তা সত্ত্বেও, এই গবেষণাটি আমাদের বর্তমান এআইগুলি কী করতে পারে তার সীমাগুলি পুনরায় বিবেচনা করার জন্য আমন্ত্রণ জানায়। যদি এই মডেলগুলি স্বতঃস্ফূর্তভাবে জটিল ধারণাগত উপস্থাপনা তৈরি করতে পরিচালনা করে, তবে এটি ইঙ্গিত করতে পারে যে বুদ্ধিমত্তার অনুকরণ এবং কার্যকরী বুদ্ধিমত্তার একটি রূপ থাকার মধ্যেকার সীমাটি আমরা যা ভেবেছিলাম তার চেয়ে কম স্পষ্ট।
দার্শনিক বিতর্কের বাইরে, এই অগ্রগতির রোবোটিক্স, শিক্ষা এবং মানব-মেশিন সহযোগিতার জন্য নির্দিষ্ট প্রভাব রয়েছে। একটি এআই যা আমাদের মতোই বস্তু এবং ধারণাগুলিকে একত্রিত করতে সক্ষম, আরও স্বাভাবিকভাবে যোগাযোগ করতে পারে, আমাদের চাহিদাগুলি অনুমান করতে পারে এবং অভূতপূর্ব পরিস্থিতির সাথে আরও ভালভাবে মানিয়ে নিতে পারে।
সংক্ষেপে, ChatGPT-এর মতো বৃহৎ ভাষা মডেলগুলি সাধারণ ভাষা অনুকরণকারীর চেয়ে অনেক বেশি কিছু। তাদের মানব জ্ঞানীয় ক্ষমতার কাছাকাছি বিশ্বের একটি উপস্থাপনা থাকতে পারে, যা বিশাল ডেটা থেকে তৈরি এবং জটিল তথ্যকে একত্রিত করতে সক্ষম। তবে, এই মেশিনগুলি আজও পরিশীলিত আয়না হিসাবে রয়ে গেছে, যা সরাসরি অভিজ্ঞতা ছাড়াই আমাদের জ্ঞানকে সংগঠিত করার উপায়কে প্রতিফলিত করে। তারা আমাদের মতো অনুভব করে না, বাঁচে না, চিন্তা করে না, তবে তারা একদিন আমাদের সেখানে নিয়ে যেতে পারে, আরও বুদ্ধিমান এবং স্বজ্ঞাত এআই-এর পথ প্রশস্ত করতে পারে।