Teknoloji & Yapay Zeka

Küçük Dil Modelleri İçin Araç Şemalarını Uyarlama Yaklaşımı

Araştırmacılar, küçük dil modellerinin araç kullanımındaki başarısızlıklarını farklı bir açıdan ele aldı. Geleneksel yaklaşım modelleri eğitmeye odaklanırken, yeni araştırma araç şemalarını modellerin önceden öğrendiği bilgilere uyarlamayı öneriyor. Stanford ve diğer kurumlardan araştırmacılar, modellerin ön eğitimi sırasında öğrendiği isimlendirme kalıplarını kullanan PA-Tool metodunu geliştirdi. Bu yaklaşım, modellerin var olmayan araç isimlerini 'hayal etme' sorununa çözüm getiriyor ve çok-ajan sistemlerde daha verimli işbirliği sağlıyor. Araştırma, yapay zeka sistemlerinin pratik uygulamalarında önemli ilerlemeler vaat ediyor.

Küçük dil modelleri (SLM'ler), büyük koordinatör modeller tarafından yönetilen çok-ajan sistemlerde giderek daha fazla kullanılıyor. Ancak bu modellerin araç kullanımında karşılaştığı temel sorunlardan biri 'şema uyumsuzluğu' olarak adlandırılan durum.

Araştırmacılar, modellerin ön eğitimi sırasında öğrendiği isimlendirme kalıplarının, sunulan araç şemalarındaki isimlerle uyuşmaması nedeniyle modellerin var olmayan araç isimlerini 'hayal ettiğini' tespit etti. Geleneksel çözüm modelleri yeni şemalara adapte etmek için eğitmekken, araştırma ekibi tam tersini öneriyor.

PA-Tool (Ön Eğitime Uyumlu Araç Şeması Üretimi) adlı yeni yöntem, eğitim gerektirmeyen bir yaklaşım sunuyor. Bu metod, 'peakedness' adı verilen ve modelin ön eğitim aşamasındaki aşinalığını gösteren bir sinyali kullanarak araç bileşenlerini yeniden isimlendiriyor.

Sistem, birden fazla aday isim üreterek bunlar arasından en yüksek peakedness değerine sahip olanı seçiyor. Bu sayede modeller, zaten bildiği isimlendirme kalıplarıyla çalışarak daha başarılı araç seçimi ve parametre belirleme yapabiliyor.

Araştırma, yapay zeka sistemlerinin pratik uygulamalarında önemli verimlilik artışları sağlayabilecek bu yaklaşımın, çok-ajan sistemlerde koordinasyon kalitesini artırdığını gösteriyor.

Özgün Kaynak
arXiv (CS + AI)
Don't Adapt Small Language Models for Tools; Adapt Tool Schemas to the Models
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.