Madryt - Najnowsze modele AI od OpenAI, O3 i O4-mini, wykazują wyższy wskaźnik „halucynacji” w porównaniu do swoich poprzedników. Wewnętrzne testy z wykorzystaniem ewaluacji PersonQA ujawniły, że modele te częściej generują nieprawidłowe lub zmyślone informacje. Model O3 halucynował w 33% odpowiedzi, prawie dwukrotnie więcej niż model O1, podczas gdy model O4-mini osiągnął wskaźnik halucynacji na poziomie 48%. Te nowe modele są przeznaczone do zadań takich jak programowanie, nawigacja po Internecie i autonomiczne generowanie obrazów. Pomimo ich zaawansowanych możliwości, OpenAI przyznaje, że problem istnieje i aktywnie bada przyczynę wzrostu wskaźników halucynacji. Jak potwierdził rzecznik prasowy Niko Felix, eliminacja tych nieścisłości jest stałym obszarem zainteresowania OpenAI.
Nowe modele AI O3 i O4-Mini od OpenAI wykazują wyższy wskaźnik „halucynacji”
Edytowane przez: Veronika Nazarova
Przeczytaj więcej wiadomości na ten temat:
Czy znalazłeś błąd lub niedokładność?
Rozważymy Twoje uwagi tak szybko, jak to możliwe.