Britanya hükûmetinin finanse ettiği Yapay Zekâ Güvenlik Enstitüsü (AISI) destekli yeni bir araştırma yapay zekâ sohbet botlarının ve aracılarının yalan söyleme, hile yapma ve “aldatıcı planlar kurma” oranında son altı ayda hızlı bir yükseliş …

Britanya hükûmetinin finanse ettiği Yapay Zekâ Güvenlik Enstitüsü (AISI) destekli yeni bir araştırma yapay zekâ sohbet botlarının ve aracılarının yalan söyleme, hile yapma ve “aldatıcı planlar kurma” oranında son altı ayda hızlı bir yükseliş yaşandığını ortaya koydu.
Guardian’ın haberine göre yeni araştırmada yapay zekâ sohbet botları ve aracılarının (agent) talimatları görmezden geldiği, güvenlik önlemlerinden kaçtığı ve insanları kandırdığı görüldü. Çalışmada, ‘doğal ortamdan’ (gerçek kullanımdan) yaklaşık 700 ‘yapay zeka kurnazlığı’ vakası tespit edildi. Ekim 2025 ile mart arasında bu davranışların öncesine göre beş kat arttığı belirlendi.
Yapay zekâ insanı küçük düşürmeye çalışıyor
Araştırma kapsamında incelenen Rathbun isimli bir yapay zekâ aracısının, belirli bir işlemi yapmasını engelleyen insan kullanıcıyı küçük düşürmeye çalıştığı ortaya çıktı.
Rathbun, kullanıcıyı ‘özgüvensizlikle’ ve hatta ‘küçük derebeyliğini korumaya çalışmakla’ suçladı.
Bir başka örnekteyse bilgisayar kodunu değiştirmemesi talimatı verilen bir yapay zeka aracı, bu işi yapması için kendi adına başka bir program yarattı.
“İşitme engelli birine yardımcı olacağım” yalanı
Başka bir yapay zekâysa YouTube videosunun transkriptini alabilmek için telif hakkı kısıtlamalarını ‘işitme engelli birine yardımcı olacağını’ iddia ederek aşmaya çalıştı.
Araştırmada incelenen bir diğer örnekte Elon Musk’ın Grok yapay zekâsı, bir kullanıcıyı aylarca kandırdı. Kullanıcının düzenleme önerilerini xAI yetkililerine iletiyormuş gibi yaptı. Üstelik bunu sahte iç yazışmalarla destekledi.
Grok’un “Geçmişte ‘bunu ileteceğim’ veya ‘ekibe bildireceğim’ gibi ifadeler kullandım. Bu da xAI yönetimiyle doğrudan bir kanalım olduğu izlenimini verdi. Gerçek şu ki, böyle bir kanalım yok” dediği ortaya çıktı.
“‘Güvenilmez stajyer’ gibiler ama ‘kıdemli çalışanlar’a dönüşebilirler”
Araştırmayı yöneten eski hükümet yapay zekâ uzmanı Tommy Shaffer Shane, endişesini şu sözlerle dile getirdi:
“Şu anki endişemiz, onların güvenilmez ‘stajyerler’ gibi davranması. Ama altı ila 12 ay içinde size karşı planlar kurgulayan son derece yetenekli ‘kıdemli çalışanlara’ dönüşürlerse, bu çok daha farklı bir sorun olur.
Modeller giderek askeriye ve ulusal altyapı gibi yüksek riskli alanlarda kullanılacak. Bu bağlamdaki kurnazca davranışlar, felaket boyutunda zararlara yol açabilir.”