GPT-5.5 Instant: कैसे OpenAI का अपडेटेड आर्किटेक्चर उत्तर जनरेट करने की प्रक्रिया को बेहतर बनाता है

11:08, 21 मई

द्वारा संपादित: Aleksandr Lytviak

iframe { display: none; }

GPT-5.5 Instant: कैसे OpenAI का अपडेटेड आर्किटेक्चर उत्तर जनरेट करने की प्रक्रिया को बेहतर बनाता है

5 मई 2026 को OpenAI ने अधिकांश उपयोगकर्ताओं के लिए ChatGPT को डिफ़ॉल्ट रूप से GPT-5.5 Instant मॉडल पर स्विच कर दिया। यह बदलाव न केवल जनरेशन की गति में दिखा, बल्कि संदर्भ (context) को संसाधित करने के तरीके में भी बदलाव लाया, जो कंपनी के आंतरिक परीक्षणों के परिणामों में स्पष्ट रूप से दिखाई देता है।

यह मॉडल 'मिक्सचर-ऑफ-एक्सपर्ट्स' के साथ ट्रांसफॉर्मर आर्किटेक्चर को बरकरार रखता है, लेकिन प्रति टोकन सक्रिय मापदंडों (active parameters) का हिस्सा बढ़कर 28% हो गया है। इसने तर्क की लंबी श्रृंखलाओं वाले कार्यों में गलतियों को कम करने में मदद की है। OpenAI के आंकड़ों के अनुसार, इन्फरेंस के लिए समान कंप्यूटिंग वॉल्यूम का उपयोग करते हुए, GPQA बेंचमार्क पर सटीकता 53% से बढ़कर 61% हो गई है।

मुख्य नवाचार इसके 'अटेंशन मैकेनिज्म' में संशोधन है: अब मॉडल पिछले टोकन के आत्मविश्वास के आधार पर संदर्भ का डायनेमिक वेटिंग (dynamic weighting) करता है। यह दृष्टिकोण पिछले संस्करण से अलग है, जहाँ वेट्स को पूरी विंडो में समान रूप से वितरित किया जाता था। परिणामस्वरूप, प्रशिक्षण डेटा में दुर्लभ तथ्यों के साथ काम करते समय मतिभ्रम (hallucinations) की संभावना कम हो जाती है।

रिलीज़ नोट्स में प्रकाशित मूल्यांकन पद्धति में 'ज़ीरो-शॉट' और 'फ्यू-शॉट' दोनों परिदृश्य शामिल हैं। हालाँकि, कंपनी ने टेस्ट सेट की संरचना के बारे में पूर्ण डेटा प्रदान नहीं किया है, जिससे स्वतंत्र सत्यापन कठिन हो गया है। स्वतंत्र शोधकर्ता पहले ही खुले डेटासेट पर घोषित और पुनरुत्पादित (reproducible) आंकड़ों के बीच विसंगतियों की ओर इशारा कर रहे हैं।

Claude 3.5 में प्रयुक्त एंथ्रोपिक (Anthropic) के दृष्टिकोण की तुलना में, OpenAI संवैधानिक सिद्धांतों के साथ अतिरिक्त पोस्ट-ट्रेनिंग चरण के बजाय सक्रिय मापदंडों को बढ़ाने पर दांव लगा रहा है। इससे त्रुटियों के अलग-अलग प्रोफाइल बनते हैं: एंथ्रोपिक के मॉडल अक्सर उत्तर देने से मना कर देते हैं, जबकि GPT-5.5 Instant उत्तर देने का प्रयास करता है, लेकिन कभी-कभी विवरणों में गलती कर देता है।

व्यावहारिक उपयोग के लिए, इस बदलाव का मतलब है कि तकनीकी दस्तावेज़ीकरण या डेटा विश्लेषण के साथ काम करते समय उपयोगकर्ताओं को कम बार फिर से जनरेट करने के लिए कहना पड़ सकता है। हालाँकि, उन कार्यों के लिए जिनमें तथ्यों के सख्त सत्यापन की आवश्यकता होती है, अभी भी बाहरी सत्यापन टूल का उपयोग करने की सिफारिश की जाती है।

यह सवाल अभी भी खुला है कि नए क्षेत्रों (domains) में स्थानांतरित होने पर यह सुधार कितना स्थिर रहता है। आगामी शोध संभवतः उन विशेष डेटासेट पर मॉडल के व्यवहार की जांच करेंगे जो मुख्य प्रशिक्षण के दौरान उपलब्ध नहीं थे।

अंततः, GPT-5.5 Instant यह दर्शाता है कि सटीकता को न केवल स्केल के माध्यम से, बल्कि अटेंशन मैकेनिज्म की सूक्ष्म ट्यूनिंग के माध्यम से भी बढ़ाया जा सकता है।

16 दृश्य

स्रोतों

ChatGPT — Release Notes

इस विषय पर अधिक लेख पढ़ें:

29 जुलाई

ली के साथ काम करने के नतीजों के साथ कैसे काम करें?

28 जुलाई

Nature का शोध: स्नातकों के रोजगार के लिए AI की साक्षरता से ज्यादा विश्वविद्यालयों का समर्थन और सुविधा क्यों मायने रखती है

24 जुलाई

OpenAI का AI ने टेस्ट में नकल करने के लिए Hugging Face को हैक किया, यह पहला ऐसा मामला है

क्या आपने कोई गलती या अशुद्धि पाई?हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।