OpenAI 的實驗性推理語言模型在 2025 年國際數學奧林匹克競賽(IMO)中取得了金牌級別的表現,成功解決了六個問題中的五個,總得分為 35 分(滿分 42 分)。
該模型在與人類參賽者相同的條件下進行測試,包括兩個 4.5 小時的考試環節,期間無法使用外部工具或互聯網,並需用自然語言撰寫詳細的數學證明。三位前 IMO 獎牌得主獨立評分,最終達成一致,確認該模型的金牌級別表現。
這一成就標誌著 AI 在解決複雜數學問題方面的重大進步,展示了其在一般推理和計算能力方面的潛力。OpenAI 表示,雖然該模型目前尚未公開發布,但計劃在未來幾個月內推出 GPT-5,預期將進一步提升 AI 在數學推理領域的能力。