Nowe modele AI O3 i O4-Mini od OpenAI wykazują wyższy wskaźnik „halucynacji”

Edytowane przez: Veronika Nazarova

Madryt - Najnowsze modele AI od OpenAI, O3 i O4-mini, wykazują wyższy wskaźnik „halucynacji” w porównaniu do swoich poprzedników. Wewnętrzne testy z wykorzystaniem ewaluacji PersonQA ujawniły, że modele te częściej generują nieprawidłowe lub zmyślone informacje. Model O3 halucynował w 33% odpowiedzi, prawie dwukrotnie więcej niż model O1, podczas gdy model O4-mini osiągnął wskaźnik halucynacji na poziomie 48%. Te nowe modele są przeznaczone do zadań takich jak programowanie, nawigacja po Internecie i autonomiczne generowanie obrazów. Pomimo ich zaawansowanych możliwości, OpenAI przyznaje, że problem istnieje i aktywnie bada przyczynę wzrostu wskaźników halucynacji. Jak potwierdził rzecznik prasowy Niko Felix, eliminacja tych nieścisłości jest stałym obszarem zainteresowania OpenAI.

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.