Yapay zeka alanında çığır açan bir gelişme yaşandı. Büyük dil modelleri artık hiçbir ek eğitim almadan karmaşık mantıksal düşünme becerilerini kazanabiliyor. Geleneksel yöntemlerde bu tür yetenekler için kaynak yoğun eğitim süreçleri gerekiyordu.

Araştırmacıların geliştirdiği ThinkLogit yaklaşımı, logit aritmetiği kullanarak küçük bir rehber modelden büyük hedef modele bilgi aktarımı gerçekleştiriyor. Bu yöntemle, 21 kat daha küçük R1-Distill-Qwen-1.5B modeli, Qwen2.5-32B gibi büyük bir modele rehberlik edebiliyor.

Sistem, geriye dönük izleme ve kendi kendini doğrulama gibi gelişmiş stratejiler kullanarak uzun mantık zincirleri oluşturabiliyor. ThinkLogit-DPO adı verilen geliştirilmiş versiyonda ise, rehber model hedef modelin hatalarını düzeltmek için özel olarak eğitiliyor.

Altı farklı mantıksal düşünme testinde yapılan değerlendirmeler, matematik, bilim ve kodlama alanlarında başarılı sonuçlar verdi. Bu yaklaşım, AI modellerinin geliştirilmesinde maliyet etkin bir alternatif sunarak, gelecekte daha erişilebilir akıllı sistemlerin yolunu açabilir.