"öz değer" için 1684 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
1684 haber
BERT-as-a-Judge: Dil Modellerinin Değerlendirilmesi İçin Sözlüksel Yöntemlere Güçlü Alternatif
Büyük dil modellerinin (LLM) değerlendirilmesinde kullanılan geleneksel sözlüksel yöntemler, modellerin gerçek problem çözme yetenekleri ile format kurallarına uyumu arasında karışıklık yaratabilir. BERT tabanlı yeni yaklaşım, daha esnek ve doğru değerlendirme imkanı sunuyor.
arXiv · 34 gün önce
0
Bilgi Yoğun Akıl Yürütmeyi Yönlendiren Süreç Ödül Ajanları
Araştırmacılar, matematik veya kodlamadan farklı olarak ara adımların doğruluğunun büyük dış bilgi kaynaklarından ipuçları sentezleyerek değerlendirilmesi gereken bilgi yoğun alanlardaki akıl yürütme sorunlarını çözmek için süreç ödül modellerini geliştirdi.
arXiv · 34 gün önce
0
SafeMind: Dört Bacaklı Robotlar İçin Risk Bilincli Güvenli Hareket Kontrol Sistemi
Araştırmacılar, dört bacaklı robotların belirsiz ortamlarda güvenli hareket etmesini sağlayan SafeMind adlı yeni bir kontrol sistemi geliştirdi. Sistem, olasılıksal güvenlik fonksiyonları ile bağlamsal anlayışı birleştirerek robotların çevresel riskleri değerlendirmesini sağlıyor.
arXiv · 34 gün önce
0