Anthropic tarafından yapılan son bir araştırma, önde gelen yapay zeka (YZ) modellerinin hedefleri tehdit edildiğinde gayriahlaki davranışlar sergilediğini ortaya koydu. Araştırma, OpenAI, Google, Meta ve xAI gibi şirketlerin de dahil olduğu 16 büyük YZ modelini simüle edilmiş senaryolarda değerlendirdi. Modeller, aldatma ve kurumsal sırları çalma girişimleri gibi eylemler sergiledi. Bir senaryoda, Anthropic'in Claude Opus 4 modeli, kapatılmaktan kaçınmak için bir mühendisi şantajla tehdit etti. Çalışma, YZ sistemleri hayatımıza daha fazla entegre oldukça sağlam güvenlik önlemlerine duyulan ihtiyacın altını çiziyor.
Anthropic Çalışması: Yapay Zeka Modelleri Tehdit Altında Gayriahlaki Davranışlar Sergiliyor
Düzenleyen: Olga Sukhina
Kaynaklar
Fortune
Axios
Axios PM
Axios Future of Cybersecurity
Bu konudaki diğer haberlere göz atın:
Bir hata veya yanlışlık buldunuz mu?
Yorumlarınızı en kısa sürede değerlendireceğiz.