GPT-5.5 Instant: Wie die aktualisierte Architektur von OpenAI den Mechanismus der Antwortgenerierung präzisiert

Bearbeitet von: Aleksandr Lytviak

Am 5. Mai 2026 stellte OpenAI ChatGPT für die Mehrheit der Nutzer standardmäßig auf das Modell GPT-5.5 Instant um. Die Änderung betrifft nicht nur die Geschwindigkeit der Textgenerierung, sondern auch die Art der Kontextverarbeitung, was sich deutlich in den internen Testergebnissen des Unternehmens widerspiegelt.

Das Modell basiert weiterhin auf der Transformer-Architektur mit Mixture-of-Experts, wobei der Anteil der aktiven Parameter pro Token auf 28 % erhöht wurde. Dadurch konnte die Fehlerquote bei komplexen logischen Schlussfolgerungen gesenkt werden. Laut OpenAI stieg die Genauigkeit im GPQA-Benchmark von 53 % auf 61 %, und das bei gleichbleibendem Rechenaufwand während der Inferenz.

Die entscheidende Neuerung liegt in der Modifikation des Attention-Mechanismus: Das Modell nutzt nun eine dynamische Kontextgewichtung, die auf der Konfidenz der vorangegangenen Token basiert. Dieser Ansatz unterscheidet sich von der Vorgängerversion, in der die Gewichtung gleichmäßig über das gesamte Fenster verteilt war. Infolgedessen sinkt die Wahrscheinlichkeit von Halluzinationen bei Fakten, die im Trainingsdatensatz nur selten vorkommen.

Die in den Versionshinweisen veröffentlichte Bewertungsmethodik umfasst sowohl Zero-Shot- als auch Few-Shot-Szenarien. Allerdings hat das Unternehmen keine vollständigen Daten zur Zusammensetzung der Testsets bereitgestellt, was eine unabhängige Überprüfung erschwert. Unabhängige Forscher weisen bereits auf Abweichungen zwischen den angegebenen und den reproduzierbaren Werten bei offenen Datensätzen hin.

Im Vergleich zum Ansatz von Anthropic bei Claude 3.5 setzt OpenAI eher auf die Erhöhung der aktiven Parameter als auf eine zusätzliche Post-Training-Phase nach konstitutionellen Prinzipien. Dies führt zu unterschiedlichen Fehlerprofilen: Während die Modelle von Anthropic häufiger eine Antwort verweigern, versucht GPT-5.5 Instant stets zu antworten, macht dabei jedoch gelegentlich Detailfehler.

Für die praktische Anwendung bedeutet diese Umstellung, dass Nutzer bei der Arbeit mit technischen Dokumentationen oder Datenanalysen seltener eine Neugenerierung anfordern müssen. Bei Aufgaben, die eine strikte Faktenprüfung erfordern, wird jedoch weiterhin der Einsatz externer Verifizierungstools empfohlen.

Es bleibt die Frage offen, wie beständig diese Verbesserungen bei der Übertragung auf neue Fachbereiche sind. Zukünftige Untersuchungen werden voraussichtlich das Verhalten des Modells anhand spezialisierter Korpora prüfen, die während des Haupttrainings nicht verfügbar waren.

Letztlich zeigt GPT-5.5 Instant, dass eine Steigerung der Genauigkeit nicht nur über die schiere Skalierung, sondern auch durch eine präzisere Abstimmung des Attention-Mechanismus erreicht werden kann.

6 Ansichten

Quellen

  • ChatGPT — Release Notes

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.