Yapay zeka teknolojisinde çığır açan yeni bir araştırma, büyük dil modellerinin insan benzeri mantık yürütme konusundaki kritik eksikliklerini gün yüzüne çıkardı. Çalışma, ChatGPT gibi gelişmiş AI sistemlerinin dil görevlerinde güçlü performans sergilemesine rağmen, belirsiz durumlarda dünya bilgisini dilbilgisi yapılarıyla entegre etmede zorlandığını ortaya koyuyor.
Araştırmacılar, Türkçe'nin özel bir dilbilgisi özelliğinden yararlanarak kapsamlı deneyler gerçekleştirdi. Türkçe'deki sıfat tamlaması belirsizlikleri üzerinden yapılan testlerde, aynı cümle yapısının farklı anlamlar taşıyabildiği durumlar incelendi. Bu belirsizliklerde doğru seçimi yapabilmek için hem dilbilgisi kurallarını hem de gerçek dünya mantığını birlikte kullanmak gerekiyor.
Hızlı karar verme testlerinde insanlar, mantıklı olanı seçmede büyük başarı gösterdi. Ancak aynı testleri uygulanan Türkçe ve çok dilli AI modelleri, insanların sergilediği bu doğal yeteneği gösteremedi. Modeller, cümle yapılarını analiz etmekte başarılı olsalar da, hangi yorumun gerçek hayatta daha mantıklı olduğunu ayırt edemediler.
Bu bulgular, AI'nın dil anlama yeteneklerinin sandığımızdan daha yüzeysel olduğunu gösteriyor. Gelecekteki AI sistemlerinin insan benzeri anlayış geliştirebilmesi için, dünya bilgisini dil yapılarıyla daha etkili birleştiren yöntemler geliştirmek kritik önem taşıyor.