Yapay zeka alanında matematik problemlerini çözme konusunda önemli bir gelişme yaşandı. Araştırmacılar, modellerin kendi öğrenme süreçlerini optimize edebilen yeni bir sistem geliştirdi.

SAI-DPO (Öz-Farkındalık Yinelemeli Veri Sürekli Optimizasyonu) adı verilen bu yenilikçi yaklaşım, geleneksel eğitim yöntemlerinin temel bir eksikliğini gideriyor. Mevcut sistemler, modelin gelişen yeteneklerini göz ardı ederek sabit kriterlerle veri seçimi yapıyor. Bu durum, öğrenme verimliliğini sınırlıyor.

Yeni sistem ise tamamen farklı bir strateji benimsiyor. Model, kendi anlık performansını sürekli değerlendirerek hangi türde verilerle çalışması gerektiğine karar veriyor. Bu süreçte iki önemli metrik kullanılıyor: İlki 'Bilgi Semantik Uyumu' ile modelin zayıf olduğu alanları tespit ediyor. İkincisi ise 'Öz-Farkındalık Zorluk Derecesi' sayesinde problemlerin model için uygun zorluk seviyesini belirliyor.

Bu dinamik yaklaşım, modelin sürekli değişen yetkinlik seviyesine uygun veri seçimi yaparak öğrenme sürecini gerçek zamanlı olarak optimize ediyor. Böylece hem denetimli öğrenme hem de takviyeli öğrenme süreçlerinin etkinliği artırılıyor.

Araştırma, yapay zekanın matematik alanındaki problem çözme kapasitesini geliştirmede önemli bir adım olarak değerlendiriliyor.