"moderasyon" araması — BilimKapsül

Arama Sonuçları

16 haber

Yapay Zeka Güvenlik Araştırması: Risk Nasıl Değişiyor?

Büyük dil modellerinin güvenlik değerlendirmeleri genellikle sadece saldırı başarı oranı veya zararlı içerik sınıflandırması gibi ikili sonuçlar sunuyor. Ancak yeni bir araştırma, kullanıcının girdisi ile modelin yanıtı arasında riskin nasıl değiştiğini inceliyor. 1250 soru-cevap çiftinin analiz edildiği çalışmada, nefret, cinsellik, şiddet ve kendine zarar verme kategorileri üzerinden değerlendirme yapıldı. Bulgular, yanıtların büyük çoğunluğunun (%61) zararlılık seviyesini düşürdüğünü, %36'sının aynı seviyede kaldığını ve sadece %3'ünün daha zararlı hale geldiğini gösteriyor. Özellikle cinsel içeriğin, nefret ve şiddet içeriğine kıyasla zararsızlaştırılmasının 3 kat daha zor olduğu tespit edildi.

arXiv (Dilbilim & NLP) · 15 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Güvenliği İçin Yeni Test Zamanı Hizalama Yöntemi Geliştirildi

Araştırmacılar, yapay zeka modellerinin güvenliğini artırmak için test zamanında kelime gömme vektörlerini optimize eden yeni bir yöntem geliştirdi. Bu yaklaşım, modelin zararlı içerik üretme eğilimini azaltmak için girdi seviyesinde müdahale yapıyor. Özellikle güvenlik hizalaması yapılmış modellerde etkili olan bu teknik, modelin ret-ya-da-kabul şeklindeki ikili davranış kalıbını kontrol edebiliyor. Yöntem, siyah kutu metin moderasyon API'lerinden gradyan tahmini yaparak kelime gömme vektörlerini ayarlıyor. Bu gelişme, AI güvenliği alanında önemli bir adım olarak değerlendiriliyor çünkü mevcut modelleri yeniden eğitmeden güvenlik seviyelerini artırma imkanı sunuyor.

arXiv (Dilbilim & NLP) · 15 gün önce

Teknoloji & Yapay Zeka

Fransızca Zararlı İçerik Tespiti İçin Yeni Yapay Zeka Modeli Geliştirildi

Araştırmacılar, Fransızca zararlı içerikleri tespit edebilen ToxiFrench adlı yeni bir yapay zeka sistemi geliştirdi. 53.622 Fransızca çevrimiçi yorumdan oluşan veri seti kullanılarak eğitilen sistem, kültürel bağlama uygun şekilde toksik içerikleri belirleyebiliyor. Çalışmada şaşırtıcı bir bulguya ulaşıldı: küçük dil modelleri, bu görevde büyük modellerden daha başarılı sonuçlar veriyor. Araştırma ekibi, Chain-of-Thought adı verilen özel bir eğitim stratejisi geliştirerek modelin performansını artırdı. Bu gelişme, sosyal medya platformları ve çevrimiçi içerik moderasyonu için önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Sosyal ağlarda sevgi-nefret ilişkilerini öngören yeni yapay zeka modeli

Araştırmacılar, sosyal medya platformlarındaki olumlu ve olumsuz ilişkileri tahmin edebilen yeni bir yapay zeka sistemi geliştirdi. IDP-DSN adlı bu model, kullanıcılar arasındaki beğeni-nefret dinamiklerini ayrı ayrı analiz ederek daha doğru tahminler yapabiliyor. Sistem, daha önce hiç karşılaşmadığı kullanıcıların bile gelecekteki davranışlarını tahmin edebilme yeteneğine sahip. Bu teknoloji, sosyal medya platformlarının içerik moderasyonu, arkadaş önerisi ve topluluk yönetimi gibi alanlarda kullanılabilir. Model, geleneksel yöntemlerin aksine pozitif ve negatif sinyalleri birbirinden ayırarak çalışır ve bu sayede daha güvenilir sonuçlar üretir.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Videolardaki İlişkileri Yorumlayabilen Yeni Yapay Zeka Modeli Geliştirildi

Araştırmacılar, videolardaki nesneler ve aralarındaki ilişkileri daha iyi anlayabilen yeni bir yapay zeka modeli geliştirdi. FReMuRe adlı bu model, özellikle nadir görülen ilişkileri tespit etmede başarılı oluyor. Video analizinde yaşanan temel sorunlardan biri, bazı nesne ilişkilerinin çok sık, bazılarının ise çok nadir görülmesi. Bu durum yapay zekanın nadir ilişkileri öğrenmesini zorlaştırıyor. Yeni model, sık ve nadir ilişkileri ayrı ayrı işleyerek bu sorunu çözüyor. Araştırma, video analizi, güvenlik sistemleri ve içerik moderasyonu gibi alanlarda önemli iyileştirmeler sağlayabilir. Model ayrıca belirsizlik tahminleri yapabilen özel başlıklar kullanarak daha güvenilir sonuçlar üretiyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay zeka sohbetlerdeki zararlı içeriği nasıl daha iyi tespit edebilir?

Araştırmacılar, yapay zeka sistemlerinin sohbet ortamlarında zararlı içerikleri daha doğru tespit edebilmesi için yeni bir yöntem geliştirdi. RoTRAG adı verilen bu sistem, insan kaynaklı ahlaki kuralları kullanarak daha tutarlı ve açıklanabilir kararlar verebiliyor. Geleneksel yöntemlerden farklı olarak, her mesajı ayrı ayrı değerlendirmek yerine konuşmanın tamamını analiz ediyor ve dış kaynaklardan aldığı ahlaki rehberlikle daha güvenilir sonuçlar üretiyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Videolarda Görülmemiş Eylemleri Tespit Eden Yapay Zeka Modeli Geliştirildi

Araştırmacılar, videolarda daha önce görmediği eylemleri tanıyabilen yeni bir yapay zeka sistemi geliştirdi. DFAlign adlı bu sistem, difüzyon teknolojisini kullanarak video içeriklerindeki gereksiz bilgileri temizliyor ve eylem tespitinde daha başarılı sonuçlar elde ediyor. Geleneksel yöntemlerin aksine, bu sistem basit eylem etiketleri ile karmaşık video içerikleri arasındaki uyumsuzluğu çözmeye odaklanıyor. Teknoloji, özellikle güvenlik kameraları, spor analizi ve içerik moderasyonu gibi alanlarda devrim yaratma potansiyeli taşıyor. Sistem, videolardaki arka plan gürültüsünü bastırırken önemli eylem bilgilerini ön plana çıkarıyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Moderasyonu, Toplulukların Dil Kullanımını Anlayamıyor

Sosyal medyada marjinal topluluklar, kendilerine yönelik aşağılayıcı kelimeleri kimlik ve dayanışma aracı olarak yeniden sahipleniyor. Ancak yapay zeka tabanlı içerik moderasyon sistemleri, bu durumu nefret söyleminden ayırt edemiyor ve sonuçta bu toplulukların sesini bastırıyor. LGBTQIA+, siyahi ve kadın toplulukları üzerine yapılan araştırma, otomatik moderasyon araçlarının toplumsal bağlamı kavrayamadığını ortaya koyuyor. Çalışma, sosyal medya kullanıcılarının bu tür kelimelerin hangi durumlarda kabul edilebilir olduğu konusunda çok farklı görüşlere sahip olduğunu gösteriyor. Bu durum, yapay zeka sistemlerinin insan toplumlarının karmaşık dil dinamiklerini anlama konusundaki sınırlarını açığa çıkarıyor.

arXiv (Dilbilim & NLP) · 24 gün önce

Teknoloji & Yapay Zeka

EmoVerse: Görsel Duyguları Anlayan Yapay Zeka İçin Dev Veri Seti

Araştırmacılar, yapay zekanın görsel içeriklerdeki duyguları daha iyi anlaması için EmoVerse adlı kapsamlı bir veri seti geliştirdi. 219 bin görüntü içeren bu açık kaynak veri seti, görsellerdeki duygusal öğeleri detaylı şekilde analiz edebiliyor. Geleneksel yöntemlerden farklı olarak, her görseli arka plan-özellik-özne üçlüleri halinde parçalara ayırarak, hangi görsel unsurun hangi duyguyu tetiklediğini açıklayabiliyor. Bu yaklaşım, yapay zekanın duygusal analiz yeteneklerini önemli ölçüde geliştirerek, sosyal medya analizi, içerik moderasyonu ve insan-bilgisayar etkileşimi gibi alanlarda yeni imkanlar sunuyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Artık İroniyi Anlayabiliyor: Konuşmadaki Sarkastik Tonu Yakalama

MIT ve Stanford araştırmacıları, yapay zekanın konuşmadaki ince ironi ve sarkastik tonu tespit edebilmesi için yeni bir yöntem geliştirdi. GPT-4o ve LLaMA 3 modellerini kullanan sistem, sadece ses verisiyle %73.63 doğruluk oranında sarkastik konuşmayı tanımlayabiliyor. Araştırmacılar, podcast kayıtlarından oluşturdukları PodSarc veri setiyle bu başarıyı elde etti. Bu gelişme, özellikle sosyal medya moderasyonu, müşteri hizmetleri ve eğitim teknolojilerinde devrim yaratabilir. Geleneksel yöntemler video ve metin gibi çoklu veri kaynağına ihtiyaç duyarken, yeni sistem sadece ses dosyalarıyla çalışabiliyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Nefret Söyleminin Gizli Anlamlarını Çözmeye Çalışıyor

Sosyal medyada nefret söylemi artık sadece metin değil, görsel ve yazılı içeriğin birleştiği karmaşık formlarda ortaya çıkıyor. Araştırmacılar, bu gizli saldırıları tespit edebilmek için yeni bir yaklaşım geliştirdi. Çalışma, zararsız görünen görsel ve metin parçalarının bir araya geldiğinde nasıl nefret söylemi oluşturabileceğini inceliyor. H-VLI adı verilen yeni veri seti, bu tür örtük saldırıları analiz etmek için tasarlandı. Geleneksel sistemler bu karmaşık içerikleri tespit etmekte zorlanıyor çünkü anlamın bütün parçaların toplamından daha fazlası olduğu durumları anlayamıyorlar. Bu gelişme, siber güvenlik ve sosyal medya moderasyonu açısından büyük önem taşıyor.

arXiv (CS + AI) · 24 gün önce

← 1 2 →