Teknoloji & Yapay Zeka

EnvScaler: Yapay Zeka Eğitimi için Otomatik Ortam Üreticisi Geliştirildi

Araştırmacılar, büyük dil modellerinin (LLM) çeşitli araçlarla etkileşim kurabilmesi için gerekli eğitim ortamlarını otomatik olarak üreten EnvScaler adlı yeni bir sistem geliştirdi. Geleneksel yöntemlerde gerçek sistemlere erişim kısıtlı, simüle edilmiş ortamlar tutarsızlık gösteriyor ve manuel sandbox'lar ölçeklendirmesi zor. EnvScaler ise programatik sentez yoluyla bu sorunları çözüyor. SkelBuilder bileşeni konu madenciliği ve mantık modellemesi ile çeşitli ortam iskeletleri oluştururken, ScenGenerator her ortam için çoklu görev senaryoları üretiyor. Sistem 191 farklı ortam ve yaklaşık 7 bin senaryo sentezleyerek Qwen3 serisi modellerin eğitiminde kullanıldı. Bu gelişme, yapay zeka ajanlarının gerçek dünya görevlerinde daha etkili olması için kritik öneme sahip.

Büyük dil modellerinin (LLM) gerçek dünya uygulamalarında ajan olarak çalışabilmesi için zengin ve çeşitli etkileşim ortamlarına ihtiyaç duyuluyor. Ancak bu süreçte karşılaşılan temel zorluklar, araştırmacıları yeni çözümler aramaya yöneltiyor.

Geleneksel yaklaşımlarda gerçek sistemlere erişim genellikle kısıtlı oluyor, LLM ile simüle edilen ortamlar halüsinasyon ve tutarsızlık sorunları yaşıyor, manuel olarak oluşturulan sandbox'ların ölçeklendirilmesi ise oldukça zor. Bu sorunlara çözüm getirmek amacıyla geliştirilen EnvScaler, programatik sentez yoluyla ölçeklenebilir araç-etkileşim ortamları oluşturan otomatik bir çerçeve sunuyor.

EnvScaler sistemi iki ana bileşenden oluşuyor. İlk bileşen olan SkelBuilder, konu madenciliği, mantık modellemesi ve kalite değerlendirmesi aracılığıyla çeşitli ortam iskeletleri inşa ediyor. İkinci bileşen ScenGenerator ise her ortam için çoklu görev senaryoları ve kural tabanlı yörünge doğrulama fonksiyonları üretiyor.

Araştırma ekibi, EnvScaler ile 191 farklı ortam ve yaklaşık 7 bin senaryo sentezledi. Bu ortamlar, Qwen3 serisi modellerin Denetimli İnce Ayar (SFT) ve Pekiştirmeli Öğrenme (RL) süreçlerinde başarıyla uygulandı. Bu gelişme, yapay zeka ajanlarının karmaşık görevlerde daha etkili performans sergilemesi için önemli bir adım teşkil ediyor.

Özgün Kaynak
arXiv (CS + AI)
EnvScaler: Scaling Tool-Interactive Environments for LLM Agent via Programmatic Synthesis
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.