RunAgent: Doğal Dil Planlarını Anlayabilen Yeni Yapay Zeka Sistemi

Araştırmacılar, büyük dil modellerinin yapılandırılmış görevleri güvenilir şekilde yerine getirememesi sorununa çözüm ürettiler. RunAgent adlı yeni platform, doğal dilde yazılan planları anlayıp adım adım uygulayabiliyor. Sistem, insan benzeri problem çözme yaklaşımını taklit ederken, programlama dillerinin deterministik yapısını koruyor. RunAgent, IF, GOTO ve FORALL gibi kontrol yapılarıyla donatılmış agentic bir dil kullanarak, doğal dilin ifade gücünü programlamanın kesinliğiyle birleştiriyor. Platform, her adımda otomatik olarak kısıtlamalar türetip doğrulama yapıyor, LLM tabanlı akıl yürütme, araç kullanımı ve kod üretimi arasında dinamik seçim yapabiliyor. Hata düzeltme mekanizmalarıyla desteklenen sistem, yapay zekanın karmaşık iş akışlarını güvenilir şekilde yürütebilmesi için önemli bir adım sayılıyor.

Büyük dil modellerinin (LLM) yapılandırılmış görevleri güvenilir şekilde yerine getirememesi, yapay zeka alanında önemli bir engel oluşturuyordu. Araştırmacılar bu soruna çözüm getirmek için RunAgent adlı yenilikçi bir platform geliştirdiler.

RunAgent, insanların problem çözme yaklaşımını taklit ederek hedefe yönelik planları yürütebilen çok ajanli bir sistem. Platform, doğal dilde yazılan planları anlayıp yorumlayabilirken, aynı zamanda kısıtlamalar ve değerlendirme kriterleri aracılığıyla adım adım kontrollü yürütme sağlıyor.

Sistemin en dikkat çekici özelliği, IF, GOTO ve FORALL gibi açık kontrol yapılarıyla donatılmış 'agentic' bir dil kullanması. Bu yaklaşım, doğal dilin geniş ifade yeteneğini programlamanın deterministik yapısıyla birleştiriyor. RunAgent sadece her adımın sözdizimsel ve anlamsal doğruluğunu kontrol etmekle kalmıyor, aynı zamanda görev tanımına dayanarak otomatik olarak kısıtlamalar türetip bunları doğruluyor.

Platform, LLM tabanlı akıl yürütme, araç kullanımı ve Python gibi dillerde kod üretimi arasında dinamik seçim yapabiliyor. Hata düzeltme mekanizmalarıyla desteklenen bu sistem, yapay zekanın karmaşık iş akışlarını güvenilir şekilde yürütebilmesi için kritik bir gelişme olarak değerlendiriliyor.