Yapay zeka alanında devrim yaratan Chain-of-Thought (CoT) yöntemi, beklenmedik bir zayıflıkla karşı karşıya. Matematiksel ve mantıksal problemlerde büyük başarı gösteren bu yaklaşım, görsel-uzamsal akıl yürütmede tam tersine performansı düşürüyor.
Araştırmacılar, çok modlu büyük dil modellerinin (MRM) uzamsal zeka yeteneklerini test etmek için kapsamlı bir değerlendirme gerçekleştirdi. 17 farklı AI modelini 13 ayrı uzamsal akıl yürütme testinde değerlendiren çalışma, şaşırtıcı sonuçlar ortaya çıkardı.
En dikkat çekici bulgu, CoT yönteminin uzamsal problemlerde tutarlı bir şekilde performansı düşürmesi oldu. Bu durum, metin tabanlı adım adım düşünce zincirinin görsel-uzamsal görevler için uygun olmadığını gösteriyor.
Araştırmanın 'No-Image++' deneyimi daha da ilginç sonuçlar verdi. Modeller, hiç görsel veri olmadığında bile metin ipuçlarından yola çıkarak görsel detaylar üretmeye başladı. Bu durum, AI sistemlerinin ciddi 'kısayol öğrenme' problemleri yaşadığını ve gerçekte var olmayan görsel bilgileri hayal ettiğini ortaya koydu.
Bulgular, mevcut yapay zeka modellerinin görsel ve metinsel bilgiyi entegre etme konusunda temel eksiklikleri olduğunu gösteriyor. Uzamsal zeka gerektiren görevler için tamamen yeni, görsel odaklı akıl yürütme paradigmalarına ihtiyaç bulunduğu vurgulanıyor.