Bilişsel bilimciler, yapay zeka teknolojisinin en gelişmiş örneklerinden büyük dil modellerinin (LLM) beklenmedik bir zayıflığını ortaya çıkardı. Psikoloji alanından ödünç alınan klasik Stroop testi, bu sistemlerin düşündüğümüzden çok daha sınırlı olabileceğini gösteriyor.

Stroop testi, 1930'lardan beri kullanılan ve insanların bilişsel kontrollerini ölçen bir yöntemdir. Test sırasında kişiler, farklı renklerle yazılmış renk isimlerini okumaya çalışır. Örneğin 'kırmızı' kelimesi mavi renkle yazıldığında, beynimiz çelişkili bilgileri işlemekte zorlanır.

Araştırmacılar bu testi LLM'lere uyguladığında çarpıcı sonuçlar elde etti. Yapay zeka modelleri, insanlarda görülen bilişsel esnekliği sergileyemedi ve otomatik tepki kalıplarından kurtulmakta başarısız oldu. Bu durum, AI sistemlerinin gerçek anlamda karar verme yetisine sahip olmadığını, bunun yerine öğrendiği örüntüleri tekrarladığını düşündürüyor.

Bulgular, yapay zeka teknolojisinin mevcut sınırlarını anlamamız açısından önemli. LLM'lerin dikkat mekanizmalarındaki bu temel kısıtlama, gelecekte daha esnek ve gerçekten akıllı sistemler geliştirilmesi gerektiğini ortaya koyuyor.