Model AI Meniru Pemahaman Konseptual Manusia tentang Objek, Studi Menunjukkan

Diedit oleh: Vera Mo

Sebuah studi terbaru oleh para peneliti China telah menunjukkan bahwa model bahasa multimodal (LLM) dapat secara spontan mengembangkan representasi konseptual objek yang mirip dengan manusia.

Para peneliti menganalisis hampir 4,7 juta respons yang dihasilkan oleh AI tentang 1.854 objek yang bervariasi seperti anjing, kursi, apel, dan mobil. Model yang dipelajari termasuk ChatGPT-3.5, yang beroperasi hanya pada teks, dan Gemini Pro Vision, model multimodal yang mampu memproses gambar dan teks.

Hasilnya mengungkapkan bahwa AI ini mengorganisir objek-objek ini ke dalam 66 dimensi konseptual, jauh melebihi kategori klasik sederhana seperti "makanan" atau "perabotan." Dimensi-dimensi ini mencakup atribut halus seperti tekstur, relevansi emosional, atau kesesuaian untuk anak-anak. Dengan kata lain, AI ini tampaknya sedang membangun peta mental yang canggih, di mana objek tidak diatur secara mekanis, tetapi diklasifikasikan sesuai dengan kriteria kompleks yang menyerupai cara otak kita memilah dunia di sekitar kita.

Studi ini juga membandingkan bagaimana model AI dan otak manusia bereaksi terhadap objek yang sama. Hasilnya menunjukkan bahwa area aktivitas otak tertentu sesuai dengan apa yang AI "pikirkan" tentang objek. Konvergensi ini bahkan lebih terlihat pada model multimodal, yang menggabungkan pemrosesan visual dan semantik, sehingga meniru cara manusia menggabungkan indera untuk memahami lingkungan mereka.

Namun, penting untuk dicatat bahwa AI ini tidak memiliki pengalaman sensorik atau emosional. "Pemahaman" mereka dihasilkan dari pemrosesan statistik data, di mana mereka mengidentifikasi dan mereproduksi pola kompleks, tanpa merasakan apa yang mereka gambarkan. Inilah seluruh nuansa antara pengenalan yang canggih dan kognisi sadar yang sebenarnya.

Meskipun demikian, studi ini mengundang kita untuk memikirkan kembali batasan dari apa yang dapat dilakukan AI saat ini. Jika model-model ini berhasil menghasilkan representasi konseptual yang kompleks secara spontan, ini dapat mengindikasikan bahwa batas antara meniru kecerdasan dan memiliki bentuk kecerdasan fungsional kurang jelas daripada yang kita kira.

Di luar perdebatan filosofis, kemajuan ini memiliki implikasi konkret untuk robotika, pendidikan, dan kolaborasi manusia-mesin. AI yang mampu mengintegrasikan objek dan konsep seperti yang kita lakukan dapat berinteraksi lebih alami, mengantisipasi kebutuhan kita, dan beradaptasi lebih baik dengan situasi yang belum pernah terjadi sebelumnya.

Singkatnya, model bahasa besar seperti ChatGPT jauh lebih dari sekadar peniru bahasa sederhana. Mereka dapat memiliki bentuk representasi dunia yang dekat dengan kognisi manusia, dibangun dari data yang luas dan mampu mengintegrasikan informasi yang kompleks. Namun, mesin-mesin ini tetaplah cermin canggih, yang mencerminkan cara kita mengatur pengetahuan tanpa mengalaminya secara langsung. Mereka tidak merasakan, tidak hidup, tidak berpikir seperti kita, tetapi mereka suatu hari nanti dapat membawa kita ke sana, membuka jalan bagi AI yang semakin cerdas dan intuitif.

Sumber-sumber

  • Sciencepost

  • Multimodal LLMs Can Develop Human-like Object Concept Representations: Study

  • Chinese scientists confirm AI capable of spontaneously forming human-level cognition

  • Multimodal LLMs and the human brain create object representations in similar ways, study finds

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.