Stanford ve diğer kurumlardan araştırmacılar, yapay zeka modellerinin öğrenme sürecini köklü şekilde değiştirecek yeni bir yöntem geliştirdi. EasyRL adını verdikleri bu yaklaşım, insan bilişsel gelişim sürecini taklit ederek modellerin daha verimli öğrenmesini sağlıyor.
Mevcut büyük dil modellerinin eğitimi genellikle iki yoldan biriyle gerçekleştiriliyor: ya çok pahalı olan denetimli öğrenme ya da model çöküşü gibi ciddi sorunlara yol açabilen denetimsiz yöntemler. EasyRL bu iki yaklaşımın sorunlarını çözmek için farklı bir strateji benimsiyor.
Yöntemin temelinde, tıpkı çocukların önce basit kavramları öğrenip sonra karmaşık konulara geçmesi gibi, modellerin de kolay örneklerle başlayıp giderek zorlaşan verilerle kendilerini geliştirmesi yatıyor. Sistem önce az miktarda etiketli veriyle bir temel model oluşturuyor, ardından belirsizlik seviyelerine göre verileri bölerek işleme alıyor.
Bu yaklaşımın en önemli avantajları arasında çok daha az etiketli veriye ihtiyaç duyması ve geleneksel yöntemlerde karşılaşılan ödül hackleme ve model çöküşü sorunlarını önlemesi bulunuyor. Araştırma, yapay zeka eğitiminde hem maliyet hem de performans açısından önemli bir dönüm noktası olabilir.