एआई कोड डिबगिंग अभी भी एक चुनौती
माइक्रोसॉफ्ट रिसर्च ने OpenAI और Anthropic मॉडल की सीमाओं पर प्रकाश डाला
हाल ही में माइक्रोसॉफ्ट रिसर्च के एक अध्ययन से पता चला है कि OpenAI और Anthropic के AI मॉडल अभी भी कोड को प्रभावी ढंग से डिबग करने में चुनौतियों का सामना कर रहे हैं। अप्रैल 2025 में किए गए इस अध्ययन में, डिबगिंग टूल के साथ SWE-bench Lite बेंचमार्क का उपयोग करके Claude 3.7 Sonnet, OpenAI के o1 और OpenAI के o3-mini सहित नौ AI मॉडलों का आकलन किया गया। Claude 3.7 Sonnet ने 48.4% की उच्चतम सफलता दर हासिल की।
शोधकर्ताओं ने इस कम प्रदर्शन का कारण क्रमिक निर्णय लेने के व्यवहार का प्रतिनिधित्व करने वाले डेटा की कमी को बताया। माइक्रोसॉफ्ट रिसर्च डिबग-जिम भी पेश कर रहा है, जो कोड को डिबग करने की जटिल कला में एआई कोडिंग टूल को प्रशिक्षित करने के लिए डिज़ाइन किया गया एक नया वातावरण है। मिश्रित परिणामों के बावजूद, शोध सॉफ्टवेयर विकास में मानव विशेषज्ञता की निरंतर आवश्यकता और एआई डिबगिंग क्षमताओं में भविष्य में होने वाली प्रगति की क्षमता को रेखांकित करता है।