EvoTest: Kendini Geliştirebilen Yapay Zeka Ajanları İçin Yeni Yaklaşım

20 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, mevcut yapay zeka ajanlarının yeni ortamlarda karşılaştıkları temel sorunu çözmek için yenilikçi bir sistem geliştirdi. Çoğu AI ajanı, bilinmeyen durumlarla karşılaştığında 'zeki ama çaresiz stajyer' gibi davranarak pratik kullanılabilirliklerini sınırlıyor. Stanford ve diğer kurumlardan araştırmacılar, bu sorunu ele almak için EvoTest adlı evrimsel öğrenme çerçevesini geliştirdi. Sistem, ajanların test sırasında karmaşık becerileri anında öğrenmesini sağlıyor. Jericho Test-Time Learning benchmark'ı üzerinde yapılan testler, mevcut yansıtma ve hafıza tabanlı yöntemlerin yetersiz kaldığını gösterdi. EvoTest ise her bölüm sonrası tüm ajansal sistemi evrimleştirerek, hiçbir ince ayar olmadan performans artışı sağlıyor.

Yapay zeka alanında önemli bir adım atan araştırmacılar, mevcut AI ajanlarının en büyük zayıflığını hedef alan yeni bir sistem geliştirdi. EvoTest adlı bu yenilikçi yaklaşım, yapay zeka ajanlarının yeni ortamlarda karşılaştıkları durumları anında öğrenmesini ve performanslarını sürekli artırmalarını sağlıyor.

Araştırma ekibi, mevcut AI ajanlarının novel ortamlarda 'zeki ama çaresiz stajyer' gibi davrandığını ve bu durumun pratik uygulamalarda ciddi sınırlamalar yarattığını tespit etti. Bu problemi sistematik olarak ölçmek için Jericho Test-Time Learning (J-TTL) benchmark'ını geliştirdiler. Bu değerlendirme sisteminde ajanlar, aynı oyunu ardışık bölümler halinde oynayarak her seferinde performanslarını artırmaya çalışıyor.

J-TTL testlerinde, mevcut adaptasyon yöntemlerinin -yansıtma, hafıza ve pekiştirmeli öğrenme gibi- yetersiz kaldığı gözlemlendi. Bu açığı kapatmak için geliştirilen EvoTest, herhangi bir ince ayar veya gradyan hesabı olmadan çalışan evrimsel bir öğrenme çerçevesi sunuyor.

Sistemin mimarisi iki temel rol üzerine kurulu: oyunu oynayan Actor Agent ve sistemin evrimini yöneten bileşenler. Her bölüm sonrası tüm ajansal sistem evrimleşerek, sürekli öğrenme ve gelişim sağlanıyor. Bu yaklaşım, AI ajanlarının gerçek dünya uygulamalarında daha etkili olmalarının önünü açabilir.

EvoTest: Kendini Geliştirebilen Yapay Zeka Ajanları İçin Yeni Yaklaşım

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

MISUMI Group dijital üretim ve yapay zeka için 1 milyar dolar yatırım yapacak

3D Hacimsel Video Yayını İçin Yeni Yöntem Geliştirildi

Yeni mikroskop tekniği 3D görüntülemeyi 8 kat hızlandırıyor