Yapay zeka alanında önemli bir gelişme yaşanırken, araştırmacılar büyük dil modellerine dayalı AI ajanlarının uzun vadeli görevlerdeki performans sorunlarına odaklandı. Bu ajanlar karmaşık görevlerle karşılaştıklarında genellikle etkisiz deneme-yanılma döngülerine giriyor ve gerçekdışı eylemler üretebiliyor.

Bilim insanları, bu soruna çözüm olarak EAGLET (Efficient and Effective Global Planner Training) adlı yeni bir sistem geliştirdi. Bu sistem, plan-ve-uygula çerçevesi içinde çalışan, tak-çıkar özelliğine sahip bir global planlayıcı sunuyor.

EAGLET'in eğitim süreci iki temel aşamadan oluşuyor. İlk aşamada, araştırmacıların 'homolog konsensüs filtreleme stratejisi' olarak adlandırdıkları yöntemi kullanarak gelişmiş dil modellerinden yüksek kaliteli planlar sentezleniyor. Bu planlar daha sonra sistemin soğuk başlatma sürecinde kullanılıyor.

İkinci aşamada ise sistem, kural tabanlı pekiştirmeli öğrenme ile daha da geliştiriliiyor. Bu süreçte 'yürütücü kapasite kazancı ödülü' adı verilen yenilikçi bir ödül sistemi kullanılarak, planlayıcının değişen zorluk seviyelerindeki görev talimatlarını işleyebilmesi sağlanıyor.

Üç farklı uzun vadeli ajan görevi üzerinde gerçekleştirilen deneyler, EAGLET ile donatılmış yürütücü ajanların mevcut yöntemleri açık ara geride bıraktığını gösterdi. Bu gelişme, AI ajanlarının daha stratejik düşünmesi ve daha etkili eylem planları geliştirmesi açısından önemli bir adım olarak değerlendiriliyor.