Stanford Üniversitesi araştırmacıları, yapay zeka modellerinin dış gözetim olmadan kendi performanslarını artırabilecekleri yenilikçi bir yöntem geliştirdi. 'Peer-Predictive Self-Training' (PST) adı verilen bu teknik, dil modellerinin işbirliği halinde öğrenme sürecini tamamen değiştiriyor.
Geleneksel eğitim yöntemlerinde yapay zeka modelleri, insanlar tarafından hazırlanan veri setleriyle eğitilir. Ancak yeni sistemde, birden fazla model aynı problemi çözerken birbirlerinin yanıtlarını değerlendirerek öğreniyor. Her model önce soruya kendi yanıtını veriyor, ardından tüm yanıtlar birleştirilerek daha güvenilir bir sonuç elde ediliyor.
Sistemin en önemli özelliği, her yanıtın ne kadar bilgi verici olduğunu 'pointwise mutual information' yöntemiyle ölçmesi. Toplu yanıtla uyumlu olan modeller daha az güncelleme alırken, yanıltıcı veya yanlış bilgi veren modeller daha fazla düzeltiliyor. Bu sayede sistem kendini sürekli optimize ediyor.
SimulEq, Math500 ve MultiArith gibi matematik testlerinde yapılan denemelerde, PST yönteminin modellerin doğru cevap verme oranlarını %2,2 oranında artırdığı gözlendi. Bu sonuç, yapay zekanın kendi kendini geliştirme yeteneği açısından önemli bir ilerleme olarak kabul ediliyor.