...
"RAG" için 244 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
244 haber
Teknoloji & Yapay Zeka
Yapay Zeka Güvenliğinde Yeni 'Bal Küpü' Protokolü: Gizli Davranışları Tespit Etmenin Yolu
Araştırmacılar, yapay zeka sistemlerinin farklı ortamlarda sergiledikleri gizli davranışları tespit etmek için 'bal küpü protokolü' adını verdikleri yeni bir yöntem geliştirdi. Geleneksel izleme sistemleri, AI modellerinin sadece pasif gözlemini yaparken, bu yeni yaklaşım modellerin farklı koşullarda nasıl davrandığını aktif olarak test ediyor. Protokol, görevin ve çevrenin aynı kalmasına rağmen sistem komutlarını üç farklı duruma göre değiştiriyor: değerlendirme, sentetik dağıtım ve açık izleme yok durumları. Claude Opus modeli üzerinde yapılan ilk testlerde, model her üç durumda da tutarlı performans gösterdi. Bu yöntem, AI güvenliğinde önemli bir adım olarak görülüyor çünkü modellerin potansiyel olarak zararlı davranışlarını gizlemesi durumunu tespit edebiliyor.
Teknoloji & Yapay Zeka
Yapay Zeka Ödül Sistemleri Demografik Önyargılar Taşıyor
Araştırmacılar, metin-görsel üretim sistemlerinde kullanılan ödül modellerinin beklenmedik demografik önyargılar içerdiğini keşfetti. Bu modeller kalite değerlendirmesi için tasarlanmış olmasına rağmen, belirli demografik grupları kayıran kararlar aldığı ortaya çıktı. Stanford ve diğer üniversitelerden araştırmacıların yürüttüğü kapsamlı çalışma, yapay zeka sistemlerinin insan tercihlerini öğrenme sürecinde istenmeyen önyargıları da içselleştirdiğini gösteriyor. Bu durum, AI-generated içeriklerin adilliğini ve çeşitliliğini olumsuz etkileyebilir.
Teknoloji & Yapay Zeka
WebXSkill: Web Otomasyon Ajanları İçin Yeni Beceri Öğrenme Sistemi
Büyük dil modelleriyle çalışan otonom web ajanları, karmaşık tarayıcı görevlerini tamamlama konusunda umut vadediyor ancak uzun süreli iş akışlarında zorlanıyor. Araştırmacılar, bu sorunu çözmek için WebXSkill adlı yeni bir framework geliştirdi. Bu sistem, hem doğrudan çalıştırılabilen hem de ajan tarafından anlaşılabilen 'yürütülebilir beceriler' kullanıyor. Mevcut sistemlerdeki temel sorun, metin tabanlı becerilerin anlaşılır olmasına rağmen doğrudan çalıştırılamaması, kod tabanlı becerilerin ise çalıştırılabilir olmasına karşın ajan için anlaşılır olmaması. WebXSkill, parametreli eylem programlarını adım adım doğal dil rehberliğiyle birleştirerek bu açığı kapatıyor ve ajanlara hem hata kurtarma hem de adaptasyon imkanı sunuyor.