GPT-5.5 Instant: OpenAIの新アーキテクチャは回答生成メカニズムをいかに精緻化したか

編集者: Aleksandr Lytviak

2026年5月5日、OpenAIは大多数のユーザーに向けたデフォルトモデルをGPT-5.5 Instantへと移行しました。この変更は生成スピードのみならず、文脈の処理方法にも及んでおり、同社の内部テストの結果において顕著な差となって表れています。

本モデルはMixture-of-Experts(混合専門家)を採用したトランスフォーマー・アーキテクチャを継承していますが、1トークンあたりのアクティブパラメータの割合は28%にまで引き上げられました。これにより、長い推論の連鎖を伴うタスクでのエラー削減に成功しています。OpenAIの発表によれば、推論時の計算量を据え置いたまま、GPQAベンチマークでの精度は53%から61%へと向上しました。

今回の中核となる革新はアテンション・メカニズムの改良であり、先行するトークンの確信度に応じて文脈の重み付けを動的に変化させる手法が導入されました。これは、ウィンドウ全体に一律の重みを割り当てていた従来モデルとは異なるアプローチです。その結果、学習データへの出現頻度が低い事実を扱う際にも、ハルシネーションが発生する確率が低下しています。

リリースノートに記載された評価手法には、Zero-shotおよびFew-shotの両シナリオが含まれています。しかし、テストセットの詳細な内訳については非公表となっており、第三者による検証を難しくしています。すでに一部の独立した研究者からは、公開データセットを用いた再現実験の結果と、公表された数値との間に乖離があるとの指摘が上がっています。

Claude 3.5に代表されるAnthropic社のアプローチと比較すると、OpenAIは憲法的原則に基づく追加のポストトレーニングよりも、アクティブパラメータの増強に軸足を置いています。これがエラーの傾向の違いを生んでおり、Anthropicのモデルが回答を拒否する傾向が強いのに対し、GPT-5.5 Instantは回答を試みる一方で細部において誤りを生じさせることがあります。

実用的な観点から言えば、この変更によって技術文書の作成やデータ分析における再生成の頻度が抑制されることが期待されます。とはいえ、厳格な事実確認を要する作業においては、依然として外部の検証ツールを併用することが推奨される状況に変わりはありません。

新たなドメインに移行した際に、この性能向上がどの程度持続するかという点は、いまだ解明されていない課題です。今後の研究では、主力の学習プロセスではカバーされていない専門的なコーパスを用い、モデルの挙動が詳しく検証されることになるでしょう。

結論としてGPT-5.5 Instantは、精度の向上は単なる計算規模の拡大だけでなく、アテンション・メカニズムのより緻密なチューニングによっても達成可能であることを示しています。

6 ビュー

ソース元

  • ChatGPT — Release Notes

エラーや不正確な情報を見つけましたか?できるだけ早くコメントを考慮します。