"doğrulama sistemi" için 1872 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
1872 haber
Korece Yapay Zeka Modelleri Yerel Kültürde Zorlanıyor
Güney Koreli araştırmacılar, yapay zeka modellerinin Korece dilinde ve kültürel bağlamda ne kadar başarılı olduğunu ölçmek için KMMMU adlı yeni bir test sistemi geliştirdi. 3.466 sorudan oluşan bu kapsamlı değerlendirme, matematik, fen bilimleri ve sosyal bilimler gibi dokuz farklı alandaki görselli soruları içeriyor. Test sonuçları oldukça düşündürücü: en güçlü açık kaynak yapay zeka modeli bile sadece %42 başarı gösterirken, ticari modellerin en iyisi zor sorularda %52'ye ulaşabildi. Özellikle Kore kültürüne özgü sorularda performans %13'e varan düşüşler gösterdi. Bu çalışma, yapay zeka modellerinin küresel ölçekte geliştirilmesine rağmen yerel kültür ve dil özelliklerinde hala ciddi eksiklikleri olduğunu ortaya koyuyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Asistanı Doktor-Hasta Görüşmelerini Anlık Takip Ediyor
Araştırmacılar, doktor-hasta görüşmelerini gerçek zamanlı olarak dinleyerek elektronik sağlık kayıtlarını otomatik oluşturan yeni bir yapay zeka sistemi geliştirdi. Geleneksel sistemlerden farklı olarak, bu teknoloji pasif değil proaktif çalışıyor - konuşma sırasında sürekli analiz yaparak doktorlara anlık destek sağlıyor. Sistem, konuşmaları metne dönüştürürken gürültüyü filtreleye bildiği gibi, eksik noktalama işaretlerini ekleyip tıbbi bilgileri çıkarabiliyor. On farklı doktor-hasta görüşmesinde test edilen teknoloji, yüzde 84 doğruluk oranına ulaştı. Bu gelişme, hem doktorların iş yükünü azaltabilir hem de hasta bakım kalitesini artırabilir. Özellikle karmaşık tıbbi görüşmelerde doktorların önemli detayları kaçırmasını engelleyerek daha etkili tedavi planları oluşturulmasına katkı sağlayabilir.
arXiv (CS + AI) · 29 gün önce
0
Yapay zeka modellerinde yeni güvenlik sistemi: Çift yönlü tahmin yetisi
Bilim insanları, büyük dil modellerinin (LLM) gerçek zamanlı güvenilirliğini izlemek için yeni bir yöntem geliştirdi. 'Çift yönlü tahmin yetisi' adı verilen bu sistem, modellerin çok turlu konuşmalardaki bütünlüğünü anlık olarak kontrol edebiliyor. Mevcut değerlendirme yöntemleri ya sonradan analiz gerektiriyor ya da tek yönlü güven ölçümleri kullanıyor. Yeni sistem ise ham token istatistiklerinden yola çıkarak, modelin etkileşim yapısının sağlam kalıp kalmadığını gerçek zamanlı olarak izliyor. Araştırmacılar ayrıca 'Bilgi Dijital İkizi' adında hafif bir mimari geliştirerek bu ölçümü pratik hale getirdi. Bu yaklaşım, yüksek riskli otonom sistemlerde çalışan yapay zeka modellerinin fark edilmeden bozulmasını önleyebilir.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Denetim Sistemlerinde Coğrafi Önyargı Sorunu Ortaya Çıktı
Yeni bir araştırma, yapay zeka güvenlik protokollerinde kullanılan denetim sistemlerinin coğrafi açıdan ciddi kör noktalar taşıdığını ortaya koydu. Claude Opus 4.6 modelinin küresel AI manzarası hakkındaki bilgilerini inceleyen çalışma, belirli ülke ve bölgelerde sistemin doğruluk oranının dramatik biçimde düştüğünü gösterdi. 227 ülkeden 24.453 veri noktasını kapsayan kapsamlı analizde, AI denetim sistemlerinin farklı coğrafyalarda eşitsiz performans sergilediği belirlendi. Bu bulgu, AI güvenlik sistemlerinin küresel düzeyde güvenilir olmayabileceğine işaret ediyor ve yapay zeka teknolojilerinin dünya çapında adil dağıtımı konusunda önemli sorular gündeme getiriyor.
arXiv (CS + AI) · 29 gün önce
0
EVE: Dünya bilimi için geliştirilmiş ilk açık kaynak yapay zeka modeli
Araştırmacılar, Dünya bilimleri ve uydu gözlemleri konularında uzmanlaşmış EVE (Earth Virtual Expert) adlı ilk açık kaynak yapay zeka sistemini geliştirdi. 24 milyar parametreli bu model, geleneksel yapay zeka sistemlerinin aksine özellikle iklim değişikliği, çevre izleme ve yer bilimleri alanlarında sorulara daha doğru yanıtlar verebiliyor. EVE, Mistral Small 3.2 temelli bir model üzerine inşa edilmiş ve Dünya gözlem verileri ile eğitilmiş. Sistem, hem çoktan seçmeli hem de açık uçlu sorularda benzer boyuttaki genel amaçlı modellerden daha başarılı performans gösteriyor. 350 pilot kullanıcının test ettiği sistem, API ve web arayüzü üzerinden erişilebilir durumda. Proje, model, veri setleri ve kodları açık lisanslar altında bilim insanlarının kullanımına sunuyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Asistanları Gerçek Dünya Zorluklarında Test Edildi
Araştırmacılar, yapay zeka tabanlı asistanların gerçek dünya görevlerindeki performansını değerlendirmek için yeni bir test sistemi geliştirdi. LiveClawBench adlı bu sistem, mevcut değerlendirme yöntemlerinin eksikliklerini gideriyor. Günümüzdeki testler genellikle yapay zeka ajanlarını izole edilmiş ortamlarda değerlendiriyor, ancak gerçek kullanımda karşılaştıkları karmaşık durumları yeterince simüle etmiyor. Yeni sistem, görev zorluğunu üç boyutta analiz ediyor: çevre karmaşıklığı, bilişsel talep ve çalışma zamanı uyarlanabilirliği. Bu yaklaşım, yapay zeka asistanlarının gerçek hayattaki kompozisyonel zorluklar karşısındaki yeteneklerini daha doğru bir şekilde ölçmeyi hedefliyor.
arXiv (CS + AI) · 29 gün önce
0
Polis Eğitimi İçin Yapay Zeka: Gerçek Görüntülerden Öğrenen Sistem
Araştırmacılar, polis-sivil gerginliklerinin çözümü için yapay zeka destekli bir eğitim sistemi geliştirdi. DeEscalWild adlı bu sistem, internet videolarından toplanan 5 bin gerçek polis-sivil etkileşiminden hareketle, özenle seçilmiş 1500 yüksek kaliteli senaryo içeriyor. Geleneksel eğitim yöntemlerinin ölçeklenebilirlik ve gerçekçilik sorunlarına çözüm sunan sistem, büyük dil modellerinin aksine küçük ve hafif yapısıyla sahada kullanılabiliyor. Bu yaklaşım, hem polis güvenliği hem de toplumsal güven açısından kritik olan gerginlik azaltma becerilerinin daha etkili öğretilmesini hedefliyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Hayvan Haklarını Öğreniyor: Yeni Eğitim Yöntemi Geliştirild
Araştırmacılar, yapay zeka sistemlerinin hayvan refahını dikkate alacak şekilde eğitilmesi için yenilikçi bir yöntem geliştirdi. Dokümana dayalı eğitim yaklaşımı, geleneksel talimat verme yöntemlerine kıyasla çok daha başarılı sonuçlar verdi. Hayvan Zarar Kıyaslama Ölçeği adlı 26 soruluk test sistemi ile değerlendirilen bu yöntem, yapay zekanın etik değerleri öğrenmesi konusunda umut verici sonuçlar ortaya koydu. Çalışma, AI sistemlerinin sadece güvenli olmakla kalmayıp aynı zamanda hayvan refahı gibi önemli değerleri de içselleştirmesi gerektiğini vurguluyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay zeka hatalarına yeni çözüm: PlanCompiler sistemi geliştirildi
Büyük dil modelleri karmaşık işlemlerde sıklıkla hata yapıyor ve bu hatalar zincirleme etkiyle büyüyor. Araştırmacılar bu soruna PlanCompiler adlı yeni bir mimari ile çözüm getirdi. Sistem, yapay zekanın çalışma mantığını değiştirerek önce bir plan oluşturuyor, bu planı doğruluyor ve ancak ondan sonra çalıştırıyor. 300 farklı görevde yapılan testlerde sistem %88-100 arası başarı oranları elde etti. Bu yaklaşım özellikle SQL veritabanı işlemleri ve çok aşamalı yapılandırılmış görevlerde yapay zeka güvenilirliğini önemli ölçüde artırabileceğini gösteriyor.
arXiv (CS + AI) · 29 gün önce
0
Robotlara Modüler Yetenekler Kazandıran Yeni Sözleşme Sistemi Geliştirildi
Araştırmacılar, fiziksel robotların yeteneklerini modüler bir şekilde yönetmek için ECM Contracts adlı yeni bir arayüz modeli geliştirdi. Bu sistem, robotların farklı yetenekleri kurması, güncellemesi ve birleştirmesi sürecini standartlaştırıyor. Geleneksel yazılım arayüzlerinin aksine, ECM Contracts altı farklı boyutu dikkate alarak robotların güvenli ve uyumlu çalışmasını sağlıyor. Bu yaklaşım, robot yeteneklerinin karmaşık kombinasyonlarının güvenilir bir şekilde çalışmasını mümkün kılarak, robotik sistemlerde modülerlik ve uyumluluk sorunlarına çözüm getiriyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Şehir Trafiğini İnsan Mantığıyla Yönetmeyi Öğreniyor
Araştırmacılar, şehir trafiğini daha akıllı yönetebilmek için yeni bir yapay zeka sistemi geliştirdi. C2T adlı bu sistem, büyük dil modellerinden 'sağduyu' bilgisini öğrenerek trafik ışıklarını ve otonom araçları koordine ediyor. Geleneksel sistemler sadece kavşak yoğunluğu gibi basit metriklere odaklanırken, yeni sistem güvenlik, trafik akışının istikrarı ve sürüş konforu gibi insan odaklı hedefleri de göz önünde bulunduruyor. Çoklu kavşaklarda yapılan testlerde, mevcut en iyi yöntemlere kıyasla trafik verimliliği ve güvenlikte önemli iyileştirmeler sağlandı.
arXiv (CS + AI) · 29 gün önce
0