GPT-5.5 Instant：OpenAI 更新架構如何精進生成機制

11:08, 21 五月

编辑者： Aleksandr Lytviak

iframe { display: none; }

2026 年 5 月 5 日，OpenAI 已將多數用戶的 ChatGPT 預設模型切換為 GPT-5.5 Instant。這項更動不僅提升了生成速度，更優化了上下文處理方式，這從該公司的內部測試結果中可見一斑。

該模型維持了混合專家（mixture-of-experts）的轉換器架構，但每個權杖（token）的活躍參數比例提升至 28%。這有效減少了長鏈推理任務中的錯誤。根據 OpenAI 的數據，在推論運算量維持不變的情況下，GPQA 基準測試的準確度從 53% 提升至 61%。

核心創新在於注意力機制的改良：模型現在會根據前序權杖的信賴度，動態調整上下文權重。這種方法不同於以往版本在整個窗口均勻分配權重的做法。結果顯示，在處理訓練樣本中較罕見的事實時，模型產生幻覺的可能性有所降低。

發布說明中提到的評估方法包含零樣本（zero-shot）與少樣本（few-shot）場景。然而，由於該公司未提供測試集的完整數據，因此難以進行獨立驗證。獨立研究人員已指出，官方宣稱的指標與開源數據集上的重現結果之間存在落差。

相較於 Anthropic 在 Claude 3.5 中採用的方法，OpenAI 傾向於增加活躍參數，而非透過具備憲法原則的後訓練階段來強化。這導致了不同的錯誤特性：Anthropic 的模型較常拒絕回答，而 GPT-5.5 Instant 則會嘗試提供答案，但有時在細節上會出現失誤。

在實際應用上，這項轉變意味著用戶在處理技術文件或數據分析時，可以減少重新生成的頻率。不過，對於需要嚴格事實核查的任務，仍建議搭配外部工具進行驗證。

至於這種進步在跨入新領域時是否依然穩健，目前仍是未知數。未來的研究預計將針對模型在主要訓練期間未接觸過的專業語料庫，測試其表現。

總結而言，GPT-5.5 Instant 證明了提升準確度不只能靠擴大規模，還能透過更精細的注意力機制調整來達成。

16 浏览量

來源