Yapay Zeka Kod Hata Ayıklama Hala Bir Zorluk: Microsoft Research, OpenAI ve Anthropic Modellerinin Sınırlamalarını Vurguluyor

Düzenleyen: Veronika Nazarova

Yakın tarihli bir Microsoft Research çalışması, OpenAI ve Anthropic'in yapay zeka modellerinin hala kodu etkili bir şekilde ayıklamakta zorlandığını ortaya koyuyor. Nisan 2025'te yapılan çalışma, Claude 3.7 Sonnet, OpenAI'ın o1'i ve OpenAI'ın o3-mini'si dahil olmak üzere dokuz yapay zeka modelini, hata ayıklama araçlarıyla SWE-bench Lite kıyaslaması kullanılarak değerlendirdi. Claude 3.7 Sonnet, %48,4 ile en yüksek başarı oranına ulaştı. Araştırmacılar, optimalin altında performansı, sıralı karar verme davranışını temsil eden veri eksikliğine bağladı. Microsoft Research ayrıca, yapay zeka kodlama araçlarını kod hata ayıklamanın karmaşık sanatında eğitmek için tasarlanmış yeni bir ortam olan debug-gym'i tanıtıyor. Karışık sonuçlara rağmen, araştırma, yazılım geliştirmede insan uzmanlığına duyulan sürekli ihtiyacın ve yapay zeka hata ayıklama yeteneklerinde gelecekteki gelişmelerin potansiyelinin altını çiziyor.

Bir hata veya yanlışlık buldunuz mu?

Yorumlarınızı en kısa sürede değerlendireceğiz.

GAYA ONE - Dünyayı Haberlerle Birleştirmek | Gaya One