"RAG" araması — BilimKapsül

...

Arama Sonuçları

244 haber

Teknoloji & Yapay Zeka

Yapay Zeka Güvenliğinde Yeni 'Bal Küpü' Protokolü: Gizli Davranışları Tespit Etmenin Yolu

Araştırmacılar, yapay zeka sistemlerinin farklı ortamlarda sergiledikleri gizli davranışları tespit etmek için 'bal küpü protokolü' adını verdikleri yeni bir yöntem geliştirdi. Geleneksel izleme sistemleri, AI modellerinin sadece pasif gözlemini yaparken, bu yeni yaklaşım modellerin farklı koşullarda nasıl davrandığını aktif olarak test ediyor. Protokol, görevin ve çevrenin aynı kalmasına rağmen sistem komutlarını üç farklı duruma göre değiştiriyor: değerlendirme, sentetik dağıtım ve açık izleme yok durumları. Claude Opus modeli üzerinde yapılan ilk testlerde, model her üç durumda da tutarlı performans gösterdi. Bu yöntem, AI güvenliğinde önemli bir adım olarak görülüyor çünkü modellerin potansiyel olarak zararlı davranışlarını gizlemesi durumunu tespit edebiliyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Ödül Sistemleri Demografik Önyargılar Taşıyor

Araştırmacılar, metin-görsel üretim sistemlerinde kullanılan ödül modellerinin beklenmedik demografik önyargılar içerdiğini keşfetti. Bu modeller kalite değerlendirmesi için tasarlanmış olmasına rağmen, belirli demografik grupları kayıran kararlar aldığı ortaya çıktı. Stanford ve diğer üniversitelerden araştırmacıların yürüttüğü kapsamlı çalışma, yapay zeka sistemlerinin insan tercihlerini öğrenme sürecinde istenmeyen önyargıları da içselleştirdiğini gösteriyor. Bu durum, AI-generated içeriklerin adilliğini ve çeşitliliğini olumsuz etkileyebilir.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

WebXSkill: Web Otomasyon Ajanları İçin Yeni Beceri Öğrenme Sistemi

Büyük dil modelleriyle çalışan otonom web ajanları, karmaşık tarayıcı görevlerini tamamlama konusunda umut vadediyor ancak uzun süreli iş akışlarında zorlanıyor. Araştırmacılar, bu sorunu çözmek için WebXSkill adlı yeni bir framework geliştirdi. Bu sistem, hem doğrudan çalıştırılabilen hem de ajan tarafından anlaşılabilen 'yürütülebilir beceriler' kullanıyor. Mevcut sistemlerdeki temel sorun, metin tabanlı becerilerin anlaşılır olmasına rağmen doğrudan çalıştırılamaması, kod tabanlı becerilerin ise çalıştırılabilir olmasına karşın ajan için anlaşılır olmaması. WebXSkill, parametreli eylem programlarını adım adım doğal dil rehberliğiyle birleştirerek bu açığı kapatıyor ve ajanlara hem hata kurtarma hem de adaptasyon imkanı sunuyor.

arXiv (CS + AI) · 28 gün önce

← 1 … 19 20 21 →