Yapay zeka alanında önemli bir adım atan araştırmacılar, mevcut AI ajanlarının en büyük zayıflığını hedef alan yeni bir sistem geliştirdi. EvoTest adlı bu yenilikçi yaklaşım, yapay zeka ajanlarının yeni ortamlarda karşılaştıkları durumları anında öğrenmesini ve performanslarını sürekli artırmalarını sağlıyor.
Araştırma ekibi, mevcut AI ajanlarının novel ortamlarda 'zeki ama çaresiz stajyer' gibi davrandığını ve bu durumun pratik uygulamalarda ciddi sınırlamalar yarattığını tespit etti. Bu problemi sistematik olarak ölçmek için Jericho Test-Time Learning (J-TTL) benchmark'ını geliştirdiler. Bu değerlendirme sisteminde ajanlar, aynı oyunu ardışık bölümler halinde oynayarak her seferinde performanslarını artırmaya çalışıyor.
J-TTL testlerinde, mevcut adaptasyon yöntemlerinin -yansıtma, hafıza ve pekiştirmeli öğrenme gibi- yetersiz kaldığı gözlemlendi. Bu açığı kapatmak için geliştirilen EvoTest, herhangi bir ince ayar veya gradyan hesabı olmadan çalışan evrimsel bir öğrenme çerçevesi sunuyor.
Sistemin mimarisi iki temel rol üzerine kurulu: oyunu oynayan Actor Agent ve sistemin evrimini yöneten bileşenler. Her bölüm sonrası tüm ajansal sistem evrimleşerek, sürekli öğrenme ve gelişim sağlanıyor. Bu yaklaşım, AI ajanlarının gerçek dünya uygulamalarında daha etkili olmalarının önünü açabilir.