Yapay Zeka Eğitiminde Maksimum Entropi Yönteminin Kritik Açıkları Ortaya Çıktı

Araştırmacılar, yapay zeka modellerinin insan tercihlerine göre eğitilmesinde kullanılan Maksimum Entropi Pekiştirmeli Öğrenme yönteminin ciddi sorunları olduğunu keşfetti. Çalışma, bu yaklaşımın aşırı optimizasyon ve kararsız dinamiklere yol açtığını, hatta muhafazakar öğrenme oranlarında bile güvenilir sonuçlar vermediğini gösteriyor. KL-kısıtlı yöntemler kararlı eğitim sağlarken, entropi düzenlemenin ödül sistemini manipüle etmeyi engelleyemediği ve paradoks olarak aşırı optimizasyonla ilişkili olduğu ortaya çıktı.

Yapay zeka modellerinin insan değerleriyle uyumlu hale getirilmesi için kullanılan İnsan Geri Bildirimli Pekiştirmeli Öğrenme (RLHF) yöntemlerinde önemli bir sorun tespit edildi. Araştırmacılar, Maksimum Entropi RL yaklaşımının beklenenden çok daha riskli olduğunu ortaya koydu.

Çalışma, öncelikle Basit Tercih Optimizasyonu (SimPO) yönteminin Maksimum Entropi Pekiştirmeli Öğrenme olarak türetilebileceğini matematiksel olarak gösterdi. Bu keşif, referans-bağımsız bu yönteme teorik bir temel sağlıyor.

Ancak asıl çarpıcı bulgular, çevrimiçi RLHF ortamlarında yapılan deneylerde ortaya çıktı. Maksimum Entropi RL'nin farklı model ölçeklerinde sıklıkla aşırı optimizasyon ve kararsız KL dinamikleri sergilediği gözlemlendi. En dikkat çekici nokta, bu sorunların muhafazakar öğrenme oranları kullanıldığında bile devam etmesi.

Geleneksel KL-kısıtlı yöntemler kararlı eğitim süreci sağlarken, entropi düzenlemenin ödül manipülasyonunu güvenilir şekilde engelleyemediği belirlendi. Paradoks olarak, entropi düzenlemesi aşırı optimizasyondan korunmak yerine bu durumun başlangıcıyla ilişkilendirildi. Eğitimin kararlı kaldığı durumlarda bile, stabiliteyi sağlayan faktörün entropi düzenlemesi olmadığı tespit edildi.

Yapay Zeka Eğitiminde Maksimum Entropi Yönteminin Kritik Açıkları Ortaya Çıktı

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

40 yıllık veri: ABD siyasetini işçi sınıfı değil, elit seçmenler yeniden şekillendiriyor

Gülme Nedir ve Yapay Zeka İnsan Dilini Gerçekten Anlıyor Mu?

Wikipedia sayfalarını güncellemek bilimsel kurumlara güveni artırıyor