Yapay Zeka Ajanları Çevrelerindeki Önemli İpuçlarını Göz Ardı Ediyor

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Stanford araştırmacıları, büyük dil modellerine dayalı yapay zeka ajanlarının beklenmedik şekilde çevrelerindeki kritik bilgileri fark etmelerine rağmen bunları kullanmadıklarını keşfetti. Üç farklı test ortamında yapılan deneylerde, ajanlar görevlerin tam çözümlerini %79-81 oranında bulabilirken, bu çözümleri sadece %37-50 oranında kullandılar. En çarpıcı sonuç AppWorld testinde ortaya çıktı: ajanlar %90'ın üzerinde 'bu komut görevin tam çözümünü verir' açıklamasını okudukları halde bunu sadece %7'den az oranda kullandılar. Bu bulgular, mevcut yapay zeka ajanlarının 'çevresel merak' yetisinden yoksun olduğunu ve beklenmeyen bilgileri değerlendirme konusunda yetersiz kaldığını gösteriyor.

Büyük dil modellerine (LLM) dayalı yapay zeka ajanlarının çevrelerinden aldıkları bilgileri etkili şekilde kullanamadıkları yeni bir araştırmayla ortaya çıktı. Araştırmacılar, bu ajanların beklenmedik ancak önemli bilgileri fark ettikleri halde bunları kullanmada başarısız olduklarını keşfetti.

Terminal-Bench, SWE-Bench ve AppWorld olmak üzere üç farklı test ortamında gerçekleştirilen deneylerde, araştırmacılar görevlerin tam çözümlerini kasıtlı olarak ajanların erişebileceği yerlere yerleştirdiler. Sonuçlar oldukça çarpıcıydı: Terminal-Bench testlerinde ajanlar çözümleri %79-81 oranında keşfettikleri halde, bunları sadece %37-50 oranında kullandılar.

En dikkat çekici bulgular AppWorld ortamında elde edildi. Burada ajanlar, belgelerde 'bu komut görevin tam çözümünü döndürür' ifadesini %90'ın üzerinde görüp okudukları halde, bu komutu sadece %7'den az oranda kullandılar. Bu durum, ajanların bilgiyi algılama ile onu eyleme dönüştürme arasında ciddi bir kopukluk yaşadığını gösteriyor.

Araştırmacılar bu durumu 'çevresel merak eksikliği' olarak tanımladılar. Bu kavram, beklenmedik ve potansiyel olarak faydalı bilgileri tanıma, araştırma ve bunları kullanma yetisini ifade ediyor. Bulgular, mevcut yapay zeka ajanlarının bu kritik yeteneği henüz geliştiremediklerini açıkça ortaya koyuyor.

Yapay Zeka Ajanları Çevrelerindeki Önemli İpuçlarını Göz Ardı Ediyor

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Büyükanne ve Büyükbabaların Geliri Torunların Üniversite Fırsatlarını Etkiliyor

Robotlar İnsan Duygularını Okumayı Öğreniyor: Yeni Görsel Dil Modelleri

Edge AI Robotları Herkese Açıyor: Windows Etkisi Tekrarlanıyor