Yeni bir araştırma, bilimsel organizasyonların Wikipedia sayfalarının uzmanlar tarafından düzenli olarak güncellenmesinin halkın bu kurumlara duyduğu güveni önemli ölçüde artırdığını ortaya koydu. American Association for Anatomy'nin Wikipedia sayfası akademik bir uzman tarafından kapsamlı şekilde güncellendiğinde, okuyucular organizasyonu daha güvenilir olarak algıladı. Bu bulgu, bilim insanlarının platformu aktif olarak düzenleyerek doğru bilimsel bilgiye erişimi iyileştirmesi gerektiğini gösteriyor. Araştırma, Wikipedia'nın bilimsel kurumların halkla iletişiminde kritik rol oynadığını vurguluyor.

PsyPost 0

Teknoloji & Yapay Zeka

21 Apr

Google'ın AI özetleri Wikipedia trafiğini yüzde 15 azaltıyor

Arama motorlarının yapay zeka destekli özet özelliklerinin web sitesi trafiği üzerindeki etkisi ilk kez bilimsel olarak ölçüldü. Google'ın AI Overview özelliğinin küresel lansmanını takip eden araştırmacılar, İngilizce Wikipedia sayfalarının günlük ziyaretçi sayısında ortalama yüzde 15 düşüş tespit etti. Çalışma, farklı dillerdeki Wikipedia sayfalarını karşılaştırarak gerçek etkiyi izole etmeyi başardı. Bulgular, yayıncıların 'AI özetleri trafiğimizi çalıyor' endişelerini desteklerken, teknoloji platformlarının 'tamamlayıcı hizmet sunuyoruz' argümanlarını sorguluyor. Özellikle kültür konulu makalelerde etki daha belirgin görülürken, bu durum içerik üreticilerinin gelir modellerini yeniden düşünmek zorunda kalabileceğini gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Ajanlarının Güvenilirliğini Test Eden Yeni Ölçüt Sistemi: SeekerGym

Araştırmacılar, yapay zeka ajanlarının bilgi arama yeteneklerinin ne kadar eksiksiz ve güvenilir olduğunu değerlendiren SeekerGym adlı yeni bir ölçüt sistemi geliştirdi. Sistem, AI ajanlarının sadece doğru bilgi bulup bulmadığını değil, aynı zamanda hangi bilgileri kaçırdığını ve bu eksikliklerin farkında olup olmadığını test ediyor. Wikipedia makaleleri gibi belgeler üzerinden yapılan testlerde, ajanların bilgi arama sürecindeki belirsizliklerini ne kadar doğru tahmin edebildiği ölçülüyor. Bu geliştirme, AI sistemlerinin güvenilirliği konusundaki temel sorunlara çözüm arayışının önemli bir parçası olarak değerlendiriliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Küçük yapay zeka modelleri büyük rakiplerini yakaladı

Araştırmacılar, küçük dil modellerinin eğitimi için yenilikçi bir veri artırma stratejisi geliştirdi. Bu yöntem, farklı belgelerden alınan bağlamları eşleştirerek konuya odaklı özetleme performansını artırıyor. SciTLDR veri seti üzerinde yapılan testlerde, T5-base gibi küçük modeller, çok daha az parametre kullanmasına rağmen büyük modellerle rekabet edebilir performans gösterdi. Yöntem, Wikipedia'dan türetilen konularla zenginleştirilmiş veriler kullanarak modellerin konu-özet ilişkilerini daha etkili öğrenmesini sağlıyor. Veri artırma ölçeği arttıkça modellerin başarı oranı ve anlambilimsel uyumu da artıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka modellerinin güvenilirliği artırılıyor: Yeni 'düşünen' arama sistemi

Araştırmacılar, büyük dil modellerinin (LLM) güvenilirliğini artırmak için 'Deliberative Searcher' adlı yenilikçi bir çerçeve geliştirdi. Bu sistem, yapay zekanın verdiği cevaplara ne kadar güvenebileceğimizi daha iyi anlamamızı sağlıyor. Özellikle açık uçlu sorulara cevap verirken, model adım adım düşünce süreçleri yürütüyor ve Wikipedia gibi güvenilir kaynaklardan bilgi alarak cevaplarını doğruluyor. Sistem, pekiştirmeli öğrenme algoritmasıyla eğitiliyor ve modelin kendi güven seviyesi ile gerçekte ne kadar doğru olduğu arasındaki uyumu geliştiriyor. Bu gelişme, yapay zeka modellerinin gerçek dünya uygulamalarında daha güvenle kullanılabilmesi açısından kritik önem taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

BAGEL: Yapay Zekâ Modellerinin Hayvan Bilgisi Ölçülüyor

Araştırmacılar, büyük dil modellerinin hayvan bilgisi konusundaki uzmanlığını değerlendirmek için BAGEL adlı yeni bir kıyaslama sistemi geliştirdi. Bu sistem, yapay zekâ modellerinin taksonomi, morfoloji, yaşam alanları, davranış kalıpları ve coğrafi dağılım gibi hayvan bilimi konularındaki performanslarını ölçüyor. BAGEL, bioRxiv, Wikipedia ve diğer bilimsel kaynaklardan toplanan verilerle oluşturulmuş sorular içeriyor ve modellerin dış kaynaklara erişim olmadan ne kadar bilgi sahibi olduğunu test ediyor. Bu çalışma, genel bilgi testlerinde başarılı olan yapay zekâ sistemlerinin özelleşmiş alanlardaki performanslarının henüz net olmadığı bir dönemde önemli bir değerlendirme aracı sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

AI Ajanları Araç Kullanmada Başarılı, Navigasyonda Zayıf

Araştırmacılar, yapay zeka ajanlarının karmaşık görevlerdeki performansını ölçmek için yeni bir benchmark geliştirdi. 'The Amazing Agent Race' adlı bu test, mevcut değerlendirme sistemlerinin çoğunlukla basit, doğrusal görevlerden oluştuğunu ortaya koyuyor. Yeni benchmark, Wikipedia üzerinde gezinme, çoklu araç kullanımı ve sonuçları birleştirme gerektiren 1400 farklı görev içeriyor. Test sonuçları, en başarılı AI ajanının bile sadece %37.2 doğruluk oranına ulaşabildiğini gösteriyor. Özellikle navigasyon hatalarının dominant olduğu (%27-52 arası başarısızlık) bu çalışma, AI ajanlarının araç kullanımında güçlü olmasına rağmen karmaşık ortamlarda yön bulmakta zorlandığını kanıtlıyor.

arXiv (CS + AI) 0