Büyük dil modellerinin insan değerleriyle uyumlu hale getirilmesi, yapay zeka geliştirme sürecinin en kritik aşamalarından biri. Ancak bu süreç için gerekli insan tercih verilerinin toplanması hem maliyetli hem de zaman alıcı bir işlem. Yeni bir araştırma, bu soruna çığır açan bir çözüm sunuyor.
Bilim insanları tarafından geliştirilen 'Alignment Data Map' adlı yenilikçi araç, hangi verilerin yapay zeka eğitimi için en etkili olduğunu belirleme konusunda çok başarılı sonuçlar veriyor. Sistem, verileri üç farklı yöntemle değerlendiriyor: LLM tabanlı hakim yaklaşımı, açık ödül modeli ve referans tabanlı değerlendirme.
En dikkat çekici bulgu, sadece yüksek kalite ve düşük değişkenlik gösteren verilerin - toplam verinin sadece %33'ü - seçilmesiyle bile tam veri seti kadar etkili sonuçlar alınabilmesi. Bu sonuç, MT-Bench, Evol-Instruct ve AlpacaEval gibi standart test platformlarında doğrulandı.
Alignment Data Map'in çalışma prensibi, yanıt kalitesi ve yanıtlar arası tutarlılığı eş zamanlı olarak analiz etmesi üzerine kurulu. Bu dual yaklaşım, hem eğitim verimliliğini artırıyor hem de daha güvenilir yapay zeka sistemleri geliştirme imkanı sunuyor.