EnvScaler: Yapay Zeka Eğitimi için Otomatik Ortam Üreticisi Geliştirildi

Araştırmacılar, büyük dil modellerinin (LLM) çeşitli araçlarla etkileşim kurabilmesi için gerekli eğitim ortamlarını otomatik olarak üreten EnvScaler adlı yeni bir sistem geliştirdi. Geleneksel yöntemlerde gerçek sistemlere erişim kısıtlı, simüle edilmiş ortamlar tutarsızlık gösteriyor ve manuel sandbox'lar ölçeklendirmesi zor. EnvScaler ise programatik sentez yoluyla bu sorunları çözüyor. SkelBuilder bileşeni konu madenciliği ve mantık modellemesi ile çeşitli ortam iskeletleri oluştururken, ScenGenerator her ortam için çoklu görev senaryoları üretiyor. Sistem 191 farklı ortam ve yaklaşık 7 bin senaryo sentezleyerek Qwen3 serisi modellerin eğitiminde kullanıldı. Bu gelişme, yapay zeka ajanlarının gerçek dünya görevlerinde daha etkili olması için kritik öneme sahip.

Büyük dil modellerinin (LLM) gerçek dünya uygulamalarında ajan olarak çalışabilmesi için zengin ve çeşitli etkileşim ortamlarına ihtiyaç duyuluyor. Ancak bu süreçte karşılaşılan temel zorluklar, araştırmacıları yeni çözümler aramaya yöneltiyor.

Geleneksel yaklaşımlarda gerçek sistemlere erişim genellikle kısıtlı oluyor, LLM ile simüle edilen ortamlar halüsinasyon ve tutarsızlık sorunları yaşıyor, manuel olarak oluşturulan sandbox'ların ölçeklendirilmesi ise oldukça zor. Bu sorunlara çözüm getirmek amacıyla geliştirilen EnvScaler, programatik sentez yoluyla ölçeklenebilir araç-etkileşim ortamları oluşturan otomatik bir çerçeve sunuyor.

EnvScaler sistemi iki ana bileşenden oluşuyor. İlk bileşen olan SkelBuilder, konu madenciliği, mantık modellemesi ve kalite değerlendirmesi aracılığıyla çeşitli ortam iskeletleri inşa ediyor. İkinci bileşen ScenGenerator ise her ortam için çoklu görev senaryoları ve kural tabanlı yörünge doğrulama fonksiyonları üretiyor.

Araştırma ekibi, EnvScaler ile 191 farklı ortam ve yaklaşık 7 bin senaryo sentezledi. Bu ortamlar, Qwen3 serisi modellerin Denetimli İnce Ayar (SFT) ve Pekiştirmeli Öğrenme (RL) süreçlerinde başarıyla uygulandı. Bu gelişme, yapay zeka ajanlarının karmaşık görevlerde daha etkili performans sergilemesi için önemli bir adım teşkil ediyor.