Yapay zeka modellerinin performansını artırmak için kullanılan hibrit etiketleme sistemlerinde önemli bir gelişme kaydedildi. Cornell Üniversitesi araştırmacıları, hangi verilerin insan uzmanlar tarafından etiketlenmesi gerektiğine karar veren algoritmaları yeniden ele aldı.
Aktif sıralı tahmin destekli ortalama tahmin problemi olarak adlandırılan bu yaklaşımda, sistem her turda bir örneğin özelliklerini gözlemledikten sonra gerçek etiketini sorgulama olasılığına karar vermek zorunda. Eğer etiket sorgulanmazsa, bunun yerine makine öğrenmesi modelinin tahmini kullanılıyor.
Önceki çalışmalar belirsizlik temelli önerileri sabit bir olasılıkla birleştiren zarif bir şema önermişti. Ancak yeni araştırmada, karışım parametresinin farklı değerleri test edildiğinde ilginç bir örüntü keşfedildi: en küçük güven genişliği, sabit olasılığın ağırlığı bire yakın olduğunda, yani belirsizlik temelli bileşenin etkisinin azaldığı durumlarda ortaya çıkıyor.
Bu gözlem doğrultusunda araştırmacılar, tahmin edicinin asimptotik olmayan analizini geliştirdi ve güven aralığı üzerinde veriye bağlı bir sınır belirledi. Bulgular, veri etiketleme süreçlerinde maliyet etkinliğini artırırken doğruluğu korumak için yeni optimizasyon stratejileri sunuyor.