Büyük dil modellerinin insan benzeri akıl yürütme yetenekleri sergilemesi bilim dünyasında büyük ilgi uyandırırken, bu sistemlerin iç işleyişi hâlâ gizemini koruyordu. Yeni bir araştırma, yapay zeka modellerinin mantık yürütme sürecinde nasıl çalıştığına dair önemli ipuçları sunuyor.

Araştırmacılar, büyük dil modellerinin orta ve geç katmanlarında 'kavramsal alt uzaylar' adını verdikleri özel yapılar keşfetti. Bu yapılar, modelin farklı görevlerde çıkarım yaparken kullandığı temel temsiller olarak işlev görüyor. İlginç olan, bu temsillerin farklı bağlamlarda bile tutarlılığını koruması.

Çalışmanın en çarpıcı bulgusu, bu yapıların sadece modelin işleyişinin yan ürünü olmadığının kanıtlanması. Nedensel müdahale analizleri ile araştırmacılar, bu kavramsal alt uzayların modelin tahminlerinde doğrudan etkili olduğunu gösterdi.

Araştırma ayrıca katmanlar arası bir işbölümü ortaya çıkardı. Erken ve orta katmanlardaki dikkat mekanizmaları, bağlamsal ipuçlarını birleştirerek bu özel yapıları oluşturuyor ve geliştiriyor. Daha sonraki katmanlar ise bu hazırlanan bilgiyi kullanarak nihai tahminleri üretiyor.

Bu bulgular, yapay zekanın 'siyah kutu' olarak görülen iç işleyişini aydınlatarak, gelecekte daha güvenilir ve açıklanabilir AI sistemleri geliştirilmesine katkı sağlayabilir.