Yapay zeka araştırmacıları, arama motorlarının kalitesini artıran yeniden sıralama sistemlerinde önemli bir keşif yaptı. İlk kez sistematik olarak incelenen ölçeklendirme yasaları, bu sistemlerin performansının nasıl gelişeceğini önceden tahmin etmeyi mümkün kılıyor.
Araştırma ekibi, farklı yaklaşımlar kullanan üç tür sıralama yöntemi üzerinde çalıştı: nokta bazlı, çift bazlı ve liste bazlı hedef fonksiyonlar. Model boyutu ve eğitim süresi artırıldığında, sıralama kalitesinin matematiksel olarak öngörülebilir güç yasalarını izlediği gözlemlendi.
Çalışmada 150 milyon parametreye kadar olan modeller kullanılarak, 400 milyon ve 1 milyar parametreli modellerin performansı başarıyla tahmin edildi. Bu tahminler MSMARCO-dev ve TREC DL veri setlerinde test edildi ve sonuçların doğru ve genellikle muhafazakar olduğu görüldü.
Araştırmanın en önemli bulgusu, hesaplama kaynaklarının nasıl dağıtılması gerektiğine dair pratik kurallar sunması. Bulgular, arama metriklerinin genellikle veri ağırlıklı ölçeklendirmeyi tercih ettiğini, ancak bu önerinin eğitim hedefine göre değişebildiğini gösteriyor.
Bu keşif, endüstriyel arama sistemlerinin geliştirilmesinde büyük model eğitimlerinin planlanması için değerli rehberlik ilkeleri sağlıyor.