Büyük dil modelleri eğitim sürecinde karmaşık dilbilimsel yetenekler kazanmasına rağmen, bu becerilerin tam olarak ne zaman ve nasıl ortaya çıktığı bugüne kadar bir muamma olarak kalıyordu. Yeni bir araştırma, bu gizemin çözülmesine yardımcı olacak yenilikçi bir yöntem sunuyor.

Araştırmacılar, 'crosscoder' adını verdikleri teknikle, yapay zeka modellerinin farklı eğitim aşamalarındaki özelliklerini karşılaştırma imkanı buldu. Bu yöntem, modellerin düzensiz çoğul isim özneleri gibi trivial olmayan soyutlamaları nasıl öğrendiğini detaylı olarak izleyebiliyor.

Çalışmada geliştirilen 'Göreceli Dolaylı Etkiler' (RelIE) adlı yeni metrik, eğitim sürecinin hangi aşamalarında belirli özelliklerin görev performansı için kritik hale geldiğini tespit edebiliyor. Bu sayede araştırmacılar, dil özelliklerinin ortaya çıkışını, korunmasını ve gelişimini somut verilerle takip edebiliyor.

Açık kaynak model kontrol noktaları kullanılarak gerçekleştirilen deneyler, crosscoder teknolojisinin özellik ortaya çıkışını başarıyla tespit edebildiğini gösteriyor. Bu yaklaşım, geleneksel değerlendirme yöntemlerinin açığa çıkaramadığı model davranışlarını anlamak için yeni olanaklar sunuyor.

Araştırma, yapay zeka modellerinin içsel işleyişini daha iyi anlamamıza katkıda bulunarak, gelecekte daha şeffaf ve açıklanabilir AI sistemlerinin geliştirilmesine zemin hazırlıyor.