एआई कोड डिबगिंग अभी भी एक चुनौती: माइक्रोसॉफ्ट रिसर्च ने OpenAI और Anthropic मॉडल की सीमाओं पर प्रकाश डाला

द्वारा संपादित: Veronika Nazarova

एआई कोड डिबगिंग अभी भी एक चुनौती

माइक्रोसॉफ्ट रिसर्च ने OpenAI और Anthropic मॉडल की सीमाओं पर प्रकाश डाला

हाल ही में माइक्रोसॉफ्ट रिसर्च के एक अध्ययन से पता चला है कि OpenAI और Anthropic के AI मॉडल अभी भी कोड को प्रभावी ढंग से डिबग करने में चुनौतियों का सामना कर रहे हैं। अप्रैल 2025 में किए गए इस अध्ययन में, डिबगिंग टूल के साथ SWE-bench Lite बेंचमार्क का उपयोग करके Claude 3.7 Sonnet, OpenAI के o1 और OpenAI के o3-mini सहित नौ AI मॉडलों का आकलन किया गया। Claude 3.7 Sonnet ने 48.4% की उच्चतम सफलता दर हासिल की।

शोधकर्ताओं ने इस कम प्रदर्शन का कारण क्रमिक निर्णय लेने के व्यवहार का प्रतिनिधित्व करने वाले डेटा की कमी को बताया। माइक्रोसॉफ्ट रिसर्च डिबग-जिम भी पेश कर रहा है, जो कोड को डिबग करने की जटिल कला में एआई कोडिंग टूल को प्रशिक्षित करने के लिए डिज़ाइन किया गया एक नया वातावरण है। मिश्रित परिणामों के बावजूद, शोध सॉफ्टवेयर विकास में मानव विशेषज्ञता की निरंतर आवश्यकता और एआई डिबगिंग क्षमताओं में भविष्य में होने वाली प्रगति की क्षमता को रेखांकित करता है।

इस विषय पर और अधिक समाचार पढ़ें:

क्या आपने कोई गलती या अशुद्धि पाई?

हम जल्द ही आपकी टिप्पणियों पर विचार करेंगे।

GAYA ONE - समाचारों के साथ दुनिया को एकजुट करना | Gaya One