Yapay zeka teknolojilerinin hızla gelişmesiyle birlikte, bu sistemlerin bilişsel yeteneklerini değerlendirmek için psikoloji alanından alınan testler kullanılmaya başlandı. Son dönemde yapılan önemli bir araştırmada, büyük dil modelleri klasik Stroop testine tabi tutuldu ve şaşırtıcı sonuçlar elde edildi.
Stroop testi, psikoloji literatüründe dikkat ve bilişsel kontrol mekanizmalarını ölçmek için kullanılan temel bir araçtır. Testte katılımcılara, renk isimlerinin farklı renklerle yazıldığı kelimeler gösterilir ve kelimenin anlamını görmezden gelerek sadece mürekkebin rengini söylemeleri istenir. Örneğin, kırmızı mürekkeple yazılmış 'mavi' kelimesinde doğru cevap 'kırmızı'dır.
Suketu Patel liderliğindeki araştırma ekibi, transformer tabanlı yapay zeka modellerinin bu testteki performansını inceledi. Sonuçlar, AI sistemlerinin dikkat mekanizmalarındaki temel zayıflıkları gözler önüne serdi. Özellikle kelime listesi uzadıkça, modellerin doğruluk oranlarında çarpıcı düşüşler yaşandı.
Bu bulgular, yapay zekanın dikkat süreçlerinin insan zihnindekinden köklü şekilde farklılaştığını ortaya koyuyor. İnsan beyni bu tür çelişkili bilgileri işlerken belirli stratejiler geliştirebilirken, AI modelleri uzun listelerle karşılaştıklarında sistematik hatalar yapıyor. Araştırma, gelecekteki AI geliştirme süreçleri için önemli ipuçları sunuyor.