Büyük dil modellerinin (LLM) yapılandırılmış görevleri güvenilir şekilde yerine getirememesi, yapay zeka alanında önemli bir engel oluşturuyordu. Araştırmacılar bu soruna çözüm getirmek için RunAgent adlı yenilikçi bir platform geliştirdiler.
RunAgent, insanların problem çözme yaklaşımını taklit ederek hedefe yönelik planları yürütebilen çok ajanli bir sistem. Platform, doğal dilde yazılan planları anlayıp yorumlayabilirken, aynı zamanda kısıtlamalar ve değerlendirme kriterleri aracılığıyla adım adım kontrollü yürütme sağlıyor.
Sistemin en dikkat çekici özelliği, IF, GOTO ve FORALL gibi açık kontrol yapılarıyla donatılmış 'agentic' bir dil kullanması. Bu yaklaşım, doğal dilin geniş ifade yeteneğini programlamanın deterministik yapısıyla birleştiriyor. RunAgent sadece her adımın sözdizimsel ve anlamsal doğruluğunu kontrol etmekle kalmıyor, aynı zamanda görev tanımına dayanarak otomatik olarak kısıtlamalar türetip bunları doğruluyor.
Platform, LLM tabanlı akıl yürütme, araç kullanımı ve Python gibi dillerde kod üretimi arasında dinamik seçim yapabiliyor. Hata düzeltme mekanizmalarıyla desteklenen bu sistem, yapay zekanın karmaşık iş akışlarını güvenilir şekilde yürütebilmesi için kritik bir gelişme olarak değerlendiriliyor.