Yapay zeka sistemleri, özellikle büyük dil modelleri, test aşamasında kendi performanslarını artırmak için çoğunluğun oylamasına dayalı konsensüs yöntemlerini kullanıyor. Ancak bu yaklaşım, cevapların çok dağınık olduğu durumlarda beklenmedik sorunlara yol açabiliyor.
Mevcut Test-Zamanı Pekiştirmeli Öğrenme (TTRL) yöntemleri, sadece pozitif sahte etiketleme stratejilerine dayanıyor. Bu durum, özellikle cevap dağılımlarının çok geniş olduğu zorlu senaryolarda zayıf konsensüse neden oluyor ve istemeden yanlış çıkarım yollarını pekiştiriyor.
Araştırmacıların geliştirdiği SCRL (Seçici-Tamamlayıcı Pekiştirmeli Öğrenme) sistemi, bu etiket gürültüsü sorununun üstesinden geliyor. Sistem iki temel bileşenden oluşuyor: Seçici Pozitif Sahte Etiketleme ve Entropi-Kapılı Negatif Sahte Etiketleme.
Seçici pozitif etiketleme mekanizması, güvenilir olmayan çoğunluk kararlarını filtrelemek için sıkı konsensüs kriterleri uyguluyor. Tamamlayıcı olarak, entropi-kapılı negatif etiketleme ise TTRL alanında ilk negatif denetim mekanizmasını sunuyor.
Bu yenilik, yapay zeka sistemlerinin daha güvenilir öğrenmesini sağlayarak, özellikle belirsizliğin yüksek olduğu durumlarda daha doğru sonuçlar üretmesine katkıda bulunuyor.