Nowe modele AI O3 i O4-Mini od OpenAI wykazują wyższy wskaźnik „halucynacji”

09:56, 21 kwietnia

Edytowane przez: Veronika Radoslavskaya

Madryt - Najnowsze modele AI od OpenAI, O3 i O4-mini, wykazują wyższy wskaźnik „halucynacji” w porównaniu do swoich poprzedników. Wewnętrzne testy z wykorzystaniem ewaluacji PersonQA ujawniły, że modele te częściej generują nieprawidłowe lub zmyślone informacje. Model O3 halucynował w 33% odpowiedzi, prawie dwukrotnie więcej niż model O1, podczas gdy model O4-mini osiągnął wskaźnik halucynacji na poziomie 48%. Te nowe modele są przeznaczone do zadań takich jak programowanie, nawigacja po Internecie i autonomiczne generowanie obrazów. Pomimo ich zaawansowanych możliwości, OpenAI przyznaje, że problem istnieje i aktywnie bada przyczynę wzrostu wskaźników halucynacji. Jak potwierdził rzecznik prasowy Niko Felix, eliminacja tych nieścisłości jest stałym obszarem zainteresowania OpenAI.

Przeczytaj więcej wiadomości na ten temat:

17 kwietnia

OpenAI wprowadza modele O3 i O4-Mini, zwiększając możliwości rozumowania AI

12 kwietnia

Debugowanie kodu AI wciąż stanowi wyzwanie: Microsoft Research podkreśla ograniczenia modeli OpenAI i Anthropic

11 kwietnia

OpenAI przygotowuje się do uruchomienia modeli O3 i O4 Mini AI w związku z opóźnieniem GPT-5

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.