Các Mô Hình AI O3, O4-Mini Mới của OpenAI Cho Thấy Tỷ Lệ 'Ảo Giác' Cao Hơn

09:56, 21 tháng 4

Chỉnh sửa bởi: Veronika Radoslavskaya

Madrid - Các mô hình AI mới nhất của OpenAI, O3 và O4-mini, thể hiện tỷ lệ 'ảo giác' cao hơn so với các phiên bản tiền nhiệm. Các thử nghiệm nội bộ sử dụng đánh giá PersonQA cho thấy các mô hình này tạo ra thông tin không chính xác hoặc bịa đặt thường xuyên hơn. Mô hình O3 bị ảo giác trong 33% phản hồi, gần gấp đôi tỷ lệ của mô hình O1, trong khi mô hình O4-mini đạt tỷ lệ ảo giác là 48%. Các mô hình mới này được thiết kế cho các tác vụ như lập trình, điều hướng web và tạo hình ảnh tự động. Mặc dù có các khả năng tiên tiến, OpenAI thừa nhận vấn đề này và đang tích cực nghiên cứu nguyên nhân của việc tăng tỷ lệ ảo giác. Giải quyết những điểm không chính xác này là một lĩnh vực trọng tâm liên tục của OpenAI, như đã được xác nhận bởi người phát ngôn Niko Felix.

Đọc thêm tin tức về chủ đề này:

17 tháng 4

OpenAI ra mắt các mô hình O3 và O4-Mini, tăng cường khả năng suy luận AI

12 tháng 4

Gỡ lỗi mã AI vẫn là một thách thức: Nghiên cứu của Microsoft nhấn mạnh những hạn chế của các mô hình OpenAI và Anthropic

11 tháng 4

OpenAI Chuẩn Bị Ra Mắt Các Mô Hình AI O3 và O4 Mini Giữa Lúc GPT-5 Bị Trì Hoãn

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.