Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar AI modellerinin eğitiminde hangi verilerin kullanılacağını belirlemenin kritik önem taşıdığını ortaya koydu. Geliştirilen yeni yöntem, veri seçiminde köklü bir değişiklik öneriyor.
Answer Divergence-Guided Selection (ADG) olarak adlandırılan bu yaklaşım, aynı talimata verilen farklı yanıtların geometrik dağılımını inceleyerek çalışıyor. Sistem, her talimat için yüksek sıcaklık değerlerinde birden fazla cevap üretiyor, bu yanıtları matematiksel bir uzayda haritalandırıyor ve farklılaşma skorunu hesaplıyor.
Yöntemin en dikkat çekici yanı, hem dağılım büyüklüğünü hem de şekil anizotropisini dikkate alması. Bu sayede, birbirine benzer cevaplar yerine, gerçekten farklı ve çok boyutlu yanıtlar üreten talimatları tespit edebiliyor. Tek bir yönde kümelenmiş benzer ifadeler yerine, farklı modalitelerde dağılım gösteren cevaplar daha yüksek puan alıyor.
İki farklı model mimarisi ve üç farklı talimat veri kümesi üzerinde yapılan testlerde, sadece 10 bin ADG seçimli örnek kullanılarak ince ayar yapılan modeller, altı farklı benchmarkta güçlü seçicileri geride bıraktı. Bu testler muhakeme, bilgi ve kodlama alanlarını kapsıyordu.