Teknoloji & Yapay Zeka

Büyük Dil Modelleri İnsan Gibi Mantık Yürütemiyor

Yapay zeka alanında önemli bir araştırma, büyük dil modellerinin (LLM) insan benzeri mantık yürütme konusundaki eksiklerini ortaya çıkardı. Türkiye'de yapılan çalışma, belirsiz cümle yapılarında insanların dünya bilgisini dilbilgisi kurallarıyla başarılı şekilde birleştirirken, gelişmiş AI modellerinin bu konuda yetersiz kaldığını gösterdi. Araştırmacılar, Türkçe'deki özel cümle yapılarını kullanarak hem insanlarla hem de AI modelleriyle testler yaptı. Sonuçlar, insanların mantıklı seçimleri kolayca yaparken, dil modellerinin aynı başarıyı gösteremediğini ortaya koydu. Bu bulgu, AI'nın dil anlama yeteneklerinin görründüğünden daha sınırlı olduğunu ve gerçek dünya bilgisini etkili kullanamadığını işaret ediyor.

Yapay zeka teknolojisinde çığır açan yeni bir araştırma, büyük dil modellerinin insan benzeri mantık yürütme konusundaki kritik eksikliklerini gün yüzüne çıkardı. Çalışma, ChatGPT gibi gelişmiş AI sistemlerinin dil görevlerinde güçlü performans sergilemesine rağmen, belirsiz durumlarda dünya bilgisini dilbilgisi yapılarıyla entegre etmede zorlandığını ortaya koyuyor.

Araştırmacılar, Türkçe'nin özel bir dilbilgisi özelliğinden yararlanarak kapsamlı deneyler gerçekleştirdi. Türkçe'deki sıfat tamlaması belirsizlikleri üzerinden yapılan testlerde, aynı cümle yapısının farklı anlamlar taşıyabildiği durumlar incelendi. Bu belirsizliklerde doğru seçimi yapabilmek için hem dilbilgisi kurallarını hem de gerçek dünya mantığını birlikte kullanmak gerekiyor.

Hızlı karar verme testlerinde insanlar, mantıklı olanı seçmede büyük başarı gösterdi. Ancak aynı testleri uygulanan Türkçe ve çok dilli AI modelleri, insanların sergilediği bu doğal yeteneği gösteremedi. Modeller, cümle yapılarını analiz etmekte başarılı olsalar da, hangi yorumun gerçek hayatta daha mantıklı olduğunu ayırt edemediler.

Bu bulgular, AI'nın dil anlama yeteneklerinin sandığımızdan daha yüzeysel olduğunu gösteriyor. Gelecekteki AI sistemlerinin insan benzeri anlayış geliştirebilmesi için, dünya bilgisini dil yapılarıyla daha etkili birleştiren yöntemler geliştirmek kritik önem taşıyor.

Özgün Kaynak
arXiv (CS + AI)
Plausibility as Commonsense Reasoning: Humans Succeed, Large Language Models Do not
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.