Yapay zeka alanında önemli bir gelişme yaşanıyor: Araştırmacılar, büyük dil modellerini kullanan çok-ajan sistemlerini eğitmek için yenilikçi bir yöntem geliştirdi.

Multi-Agent Heterogeneous Group Policy Optimization (MHGPO) adını taşıyan bu yeni algoritma, farklı uzmanlık alanlarına sahip yapay zeka ajanlarının birlikte çalışmasını optimize ediyor. Geleneksel yaklaşımlar, tüm ajanları aynı şekilde ele alırken, MHGPO her ajanın benzersiz rolünü ve katkısını dikkate alıyor.

Araştırmada ele alınan temel sorun, büyük dil modellerinin statik bilgi sınırları ve tek bir çıkarım sürecinde kontrol edilebilir davranış üretmedeki zorluklarıydı. Çok-ajan arama sistemleri (MASS), bu sorunlara görev ayrıştırması ve bilgi destekli problem çözme yöntemleriyle çözüm sunuyor.

Mevcut çok-ajan pekiştirmeli öğrenme yöntemleri, ortak eylemleri değerlendirmek için büyük eleştirmen ağlarına dayanıyor ve bu durum istikrarsızlık ile yüksek bellek maliyetlerine yol açıyor. MHGPO, heterojen gruplar arasında göreli avantajları tahmin ederek politikaları güncelleyen farklı bir yaklaşım benimsiyor.

Bu gelişme, yapay zeka ajanlarının karmaşık görevlerde daha etkili işbirliği yapabilmesi açısından büyük önem taşıyor.