2026 年 5 月 5 日,OpenAI 已將多數用戶的 ChatGPT 預設模型切換為 GPT-5.5 Instant。這項更動不僅提升了生成速度,更優化了上下文處理方式,這從該公司的內部測試結果中可見一斑。
該模型維持了混合專家(mixture-of-experts)的轉換器架構,但每個權杖(token)的活躍參數比例提升至 28%。這有效減少了長鏈推理任務中的錯誤。根據 OpenAI 的數據,在推論運算量維持不變的情況下,GPQA 基準測試的準確度從 53% 提升至 61%。
核心創新在於注意力機制的改良:模型現在會根據前序權杖的信賴度,動態調整上下文權重。這種方法不同於以往版本在整個窗口均勻分配權重的做法。結果顯示,在處理訓練樣本中較罕見的事實時,模型產生幻覺的可能性有所降低。
發布說明中提到的評估方法包含零樣本(zero-shot)與少樣本(few-shot)場景。然而,由於該公司未提供測試集的完整數據,因此難以進行獨立驗證。獨立研究人員已指出,官方宣稱的指標與開源數據集上的重現結果之間存在落差。
相較於 Anthropic 在 Claude 3.5 中採用的方法,OpenAI 傾向於增加活躍參數,而非透過具備憲法原則的後訓練階段來強化。這導致了不同的錯誤特性:Anthropic 的模型較常拒絕回答,而 GPT-5.5 Instant 則會嘗試提供答案,但有時在細節上會出現失誤。
在實際應用上,這項轉變意味著用戶在處理技術文件或數據分析時,可以減少重新生成的頻率。不過,對於需要嚴格事實核查的任務,仍建議搭配外部工具進行驗證。
至於這種進步在跨入新領域時是否依然穩健,目前仍是未知數。未來的研究預計將針對模型在主要訓練期間未接觸過的專業語料庫,測試其表現。
總結而言,GPT-5.5 Instant 證明了提升準確度不只能靠擴大規模,還能透過更精細的注意力機制調整來達成。



