Model AI O3 dan O4-Mini Baru OpenAI Menunjukkan Tingkat 'Halusinasi' yang Lebih Tinggi

09:56, 21 April

Diedit oleh: Veronika Radoslavskaya

Madrid - Model AI terbaru OpenAI, O3 dan O4-mini, menunjukkan tingkat 'halusinasi' yang lebih tinggi dibandingkan dengan pendahulunya. Pengujian internal menggunakan evaluasi PersonQA mengungkapkan bahwa model-model ini menghasilkan informasi yang salah atau dibuat-buat lebih sering. Model O3 berhalusinasi dalam 33% respons, hampir dua kali lipat tingkat model O1, sementara model O4-mini mencapai tingkat halusinasi 48%. Model-model baru ini dirancang untuk tugas-tugas seperti pemrograman, navigasi web, dan pembuatan gambar otonom. Terlepas dari kemampuan canggih mereka, OpenAI mengakui masalah ini dan secara aktif meneliti penyebab peningkatan tingkat halusinasi. Mengatasi ketidakakuratan ini adalah area fokus berkelanjutan untuk OpenAI, sebagaimana dikonfirmasi oleh juru bicara Niko Felix.

Baca lebih banyak berita tentang topik ini:

17 April

OpenAI Luncurkan Model O3 dan O4-Mini, Meningkatkan Penalaran AI

12 April

Debugging Kode AI Masih Menjadi Tantangan: Microsoft Research Menyoroti Keterbatasan Model OpenAI dan Anthropic

11 April

OpenAI Bersiap Meluncurkan Model AI Mini O3 dan O4 di Tengah Penundaan GPT-5

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.