Madrid - Model AI terbaru OpenAI, O3 dan O4-mini, menunjukkan tingkat 'halusinasi' yang lebih tinggi dibandingkan dengan pendahulunya. Pengujian internal menggunakan evaluasi PersonQA mengungkapkan bahwa model-model ini menghasilkan informasi yang salah atau dibuat-buat lebih sering. Model O3 berhalusinasi dalam 33% respons, hampir dua kali lipat tingkat model O1, sementara model O4-mini mencapai tingkat halusinasi 48%. Model-model baru ini dirancang untuk tugas-tugas seperti pemrograman, navigasi web, dan pembuatan gambar otonom. Terlepas dari kemampuan canggih mereka, OpenAI mengakui masalah ini dan secara aktif meneliti penyebab peningkatan tingkat halusinasi. Mengatasi ketidakakuratan ini adalah area fokus berkelanjutan untuk OpenAI, sebagaimana dikonfirmasi oleh juru bicara Niko Felix.
Model AI O3 dan O4-Mini Baru OpenAI Menunjukkan Tingkat 'Halusinasi' yang Lebih Tinggi
Diedit oleh: Veronika Nazarova
Baca lebih banyak berita tentang topik ini:
Apakah Anda menemukan kesalahan atau ketidakakuratan?
Kami akan mempertimbangkan komentar Anda sesegera mungkin.