Các Mô Hình AI O3, O4-Mini Mới của OpenAI Cho Thấy Tỷ Lệ 'Ảo Giác' Cao Hơn

Chỉnh sửa bởi: Veronika Nazarova

Madrid - Các mô hình AI mới nhất của OpenAI, O3 và O4-mini, thể hiện tỷ lệ 'ảo giác' cao hơn so với các phiên bản tiền nhiệm. Các thử nghiệm nội bộ sử dụng đánh giá PersonQA cho thấy các mô hình này tạo ra thông tin không chính xác hoặc bịa đặt thường xuyên hơn. Mô hình O3 bị ảo giác trong 33% phản hồi, gần gấp đôi tỷ lệ của mô hình O1, trong khi mô hình O4-mini đạt tỷ lệ ảo giác là 48%. Các mô hình mới này được thiết kế cho các tác vụ như lập trình, điều hướng web và tạo hình ảnh tự động. Mặc dù có các khả năng tiên tiến, OpenAI thừa nhận vấn đề này và đang tích cực nghiên cứu nguyên nhân của việc tăng tỷ lệ ảo giác. Giải quyết những điểm không chính xác này là một lĩnh vực trọng tâm liên tục của OpenAI, như đã được xác nhận bởi người phát ngôn Niko Felix.

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.