Yapay Zeka Klasik Dikkat Testinde Başarısız Oldu

Paylaş: Kopyalandı!

Araştırmacılar, yapay zeka modellerini ünlü Stroop testine tabi tuttukları çalışmalarında, büyük dil modellerinin dikkat mekanizmalarındaki ciddi zayıflıkları ortaya çıkardı. Suketu Patel ve ekibinin yürüttüğü araştırmada, AI sistemleri renk isimlerinin farklı renklerle yazıldığı klasik psikoloji testinde insan performansının çok altında kaldı. Özellikle kelime listesi uzadıkça yapay zekanın doğruluk oranında dramatik düşüşler gözlendi. Bu bulgular, transformer tabanlı modellerin dikkat mekanizmalarının insan zihniyle fundamental farklılıklar gösterdiğini kanıtlıyor. Çalışma, AI'ın karar verme süreçlerindeki yapısal sınırlılıkları anlamamız açısından kritik önem taşıyor.

Yapay zeka teknolojilerinin hızla gelişmesiyle birlikte, bu sistemlerin bilişsel yeteneklerini değerlendirmek için psikoloji alanından alınan testler kullanılmaya başlandı. Son dönemde yapılan önemli bir araştırmada, büyük dil modelleri klasik Stroop testine tabi tutuldu ve şaşırtıcı sonuçlar elde edildi.

Stroop testi, psikoloji literatüründe dikkat ve bilişsel kontrol mekanizmalarını ölçmek için kullanılan temel bir araçtır. Testte katılımcılara, renk isimlerinin farklı renklerle yazıldığı kelimeler gösterilir ve kelimenin anlamını görmezden gelerek sadece mürekkebin rengini söylemeleri istenir. Örneğin, kırmızı mürekkeple yazılmış 'mavi' kelimesinde doğru cevap 'kırmızı'dır.

Suketu Patel liderliğindeki araştırma ekibi, transformer tabanlı yapay zeka modellerinin bu testteki performansını inceledi. Sonuçlar, AI sistemlerinin dikkat mekanizmalarındaki temel zayıflıkları gözler önüne serdi. Özellikle kelime listesi uzadıkça, modellerin doğruluk oranlarında çarpıcı düşüşler yaşandı.

Bu bulgular, yapay zekanın dikkat süreçlerinin insan zihnindekinden köklü şekilde farklılaştığını ortaya koyuyor. İnsan beyni bu tür çelişkili bilgileri işlerken belirli stratejiler geliştirebilirken, AI modelleri uzun listelerle karşılaştıklarında sistematik hatalar yapıyor. Araştırma, gelecekteki AI geliştirme süreçleri için önemli ipuçları sunuyor.

Yapay Zeka Klasik Dikkat Testinde Başarısız Oldu

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Büyükanne ve Büyükbabaların Geliri Torunların Üniversite Fırsatlarını Etkiliyor

Robotlar İnsan Duygularını Okumayı Öğreniyor: Yeni Görsel Dil Modelleri

Edge AI Robotları Herkese Açıyor: Windows Etkisi Tekrarlanıyor