"doğrulama sistemi" araması

Arama Sonuçları

1872 haber

Korece Yapay Zeka Modelleri Yerel Kültürde Zorlanıyor

Güney Koreli araştırmacılar, yapay zeka modellerinin Korece dilinde ve kültürel bağlamda ne kadar başarılı olduğunu ölçmek için KMMMU adlı yeni bir test sistemi geliştirdi. 3.466 sorudan oluşan bu kapsamlı değerlendirme, matematik, fen bilimleri ve sosyal bilimler gibi dokuz farklı alandaki görselli soruları içeriyor. Test sonuçları oldukça düşündürücü: en güçlü açık kaynak yapay zeka modeli bile sadece %42 başarı gösterirken, ticari modellerin en iyisi zor sorularda %52'ye ulaşabildi. Özellikle Kore kültürüne özgü sorularda performans %13'e varan düşüşler gösterdi. Bu çalışma, yapay zeka modellerinin küresel ölçekte geliştirilmesine rağmen yerel kültür ve dil özelliklerinde hala ciddi eksiklikleri olduğunu ortaya koyuyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Asistanı Doktor-Hasta Görüşmelerini Anlık Takip Ediyor

Araştırmacılar, doktor-hasta görüşmelerini gerçek zamanlı olarak dinleyerek elektronik sağlık kayıtlarını otomatik oluşturan yeni bir yapay zeka sistemi geliştirdi. Geleneksel sistemlerden farklı olarak, bu teknoloji pasif değil proaktif çalışıyor - konuşma sırasında sürekli analiz yaparak doktorlara anlık destek sağlıyor. Sistem, konuşmaları metne dönüştürürken gürültüyü filtreleye bildiği gibi, eksik noktalama işaretlerini ekleyip tıbbi bilgileri çıkarabiliyor. On farklı doktor-hasta görüşmesinde test edilen teknoloji, yüzde 84 doğruluk oranına ulaştı. Bu gelişme, hem doktorların iş yükünü azaltabilir hem de hasta bakım kalitesini artırabilir. Özellikle karmaşık tıbbi görüşmelerde doktorların önemli detayları kaçırmasını engelleyerek daha etkili tedavi planları oluşturulmasına katkı sağlayabilir.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay zeka modellerinde yeni güvenlik sistemi: Çift yönlü tahmin yetisi

Bilim insanları, büyük dil modellerinin (LLM) gerçek zamanlı güvenilirliğini izlemek için yeni bir yöntem geliştirdi. 'Çift yönlü tahmin yetisi' adı verilen bu sistem, modellerin çok turlu konuşmalardaki bütünlüğünü anlık olarak kontrol edebiliyor. Mevcut değerlendirme yöntemleri ya sonradan analiz gerektiriyor ya da tek yönlü güven ölçümleri kullanıyor. Yeni sistem ise ham token istatistiklerinden yola çıkarak, modelin etkileşim yapısının sağlam kalıp kalmadığını gerçek zamanlı olarak izliyor. Araştırmacılar ayrıca 'Bilgi Dijital İkizi' adında hafif bir mimari geliştirerek bu ölçümü pratik hale getirdi. Bu yaklaşım, yüksek riskli otonom sistemlerde çalışan yapay zeka modellerinin fark edilmeden bozulmasını önleyebilir.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Denetim Sistemlerinde Coğrafi Önyargı Sorunu Ortaya Çıktı

Yeni bir araştırma, yapay zeka güvenlik protokollerinde kullanılan denetim sistemlerinin coğrafi açıdan ciddi kör noktalar taşıdığını ortaya koydu. Claude Opus 4.6 modelinin küresel AI manzarası hakkındaki bilgilerini inceleyen çalışma, belirli ülke ve bölgelerde sistemin doğruluk oranının dramatik biçimde düştüğünü gösterdi. 227 ülkeden 24.453 veri noktasını kapsayan kapsamlı analizde, AI denetim sistemlerinin farklı coğrafyalarda eşitsiz performans sergilediği belirlendi. Bu bulgu, AI güvenlik sistemlerinin küresel düzeyde güvenilir olmayabileceğine işaret ediyor ve yapay zeka teknolojilerinin dünya çapında adil dağıtımı konusunda önemli sorular gündeme getiriyor.

arXiv (CS + AI) · 29 gün önce

İklim & Çevre

EVE: Dünya bilimi için geliştirilmiş ilk açık kaynak yapay zeka modeli

Araştırmacılar, Dünya bilimleri ve uydu gözlemleri konularında uzmanlaşmış EVE (Earth Virtual Expert) adlı ilk açık kaynak yapay zeka sistemini geliştirdi. 24 milyar parametreli bu model, geleneksel yapay zeka sistemlerinin aksine özellikle iklim değişikliği, çevre izleme ve yer bilimleri alanlarında sorulara daha doğru yanıtlar verebiliyor. EVE, Mistral Small 3.2 temelli bir model üzerine inşa edilmiş ve Dünya gözlem verileri ile eğitilmiş. Sistem, hem çoktan seçmeli hem de açık uçlu sorularda benzer boyuttaki genel amaçlı modellerden daha başarılı performans gösteriyor. 350 pilot kullanıcının test ettiği sistem, API ve web arayüzü üzerinden erişilebilir durumda. Proje, model, veri setleri ve kodları açık lisanslar altında bilim insanlarının kullanımına sunuyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Asistanları Gerçek Dünya Zorluklarında Test Edildi

Araştırmacılar, yapay zeka tabanlı asistanların gerçek dünya görevlerindeki performansını değerlendirmek için yeni bir test sistemi geliştirdi. LiveClawBench adlı bu sistem, mevcut değerlendirme yöntemlerinin eksikliklerini gideriyor. Günümüzdeki testler genellikle yapay zeka ajanlarını izole edilmiş ortamlarda değerlendiriyor, ancak gerçek kullanımda karşılaştıkları karmaşık durumları yeterince simüle etmiyor. Yeni sistem, görev zorluğunu üç boyutta analiz ediyor: çevre karmaşıklığı, bilişsel talep ve çalışma zamanı uyarlanabilirliği. Bu yaklaşım, yapay zeka asistanlarının gerçek hayattaki kompozisyonel zorluklar karşısındaki yeteneklerini daha doğru bir şekilde ölçmeyi hedefliyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Polis Eğitimi İçin Yapay Zeka: Gerçek Görüntülerden Öğrenen Sistem

Araştırmacılar, polis-sivil gerginliklerinin çözümü için yapay zeka destekli bir eğitim sistemi geliştirdi. DeEscalWild adlı bu sistem, internet videolarından toplanan 5 bin gerçek polis-sivil etkileşiminden hareketle, özenle seçilmiş 1500 yüksek kaliteli senaryo içeriyor. Geleneksel eğitim yöntemlerinin ölçeklenebilirlik ve gerçekçilik sorunlarına çözüm sunan sistem, büyük dil modellerinin aksine küçük ve hafif yapısıyla sahada kullanılabiliyor. Bu yaklaşım, hem polis güvenliği hem de toplumsal güven açısından kritik olan gerginlik azaltma becerilerinin daha etkili öğretilmesini hedefliyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Hayvan Haklarını Öğreniyor: Yeni Eğitim Yöntemi Geliştirild

Araştırmacılar, yapay zeka sistemlerinin hayvan refahını dikkate alacak şekilde eğitilmesi için yenilikçi bir yöntem geliştirdi. Dokümana dayalı eğitim yaklaşımı, geleneksel talimat verme yöntemlerine kıyasla çok daha başarılı sonuçlar verdi. Hayvan Zarar Kıyaslama Ölçeği adlı 26 soruluk test sistemi ile değerlendirilen bu yöntem, yapay zekanın etik değerleri öğrenmesi konusunda umut verici sonuçlar ortaya koydu. Çalışma, AI sistemlerinin sadece güvenli olmakla kalmayıp aynı zamanda hayvan refahı gibi önemli değerleri de içselleştirmesi gerektiğini vurguluyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay zeka hatalarına yeni çözüm: PlanCompiler sistemi geliştirildi

Büyük dil modelleri karmaşık işlemlerde sıklıkla hata yapıyor ve bu hatalar zincirleme etkiyle büyüyor. Araştırmacılar bu soruna PlanCompiler adlı yeni bir mimari ile çözüm getirdi. Sistem, yapay zekanın çalışma mantığını değiştirerek önce bir plan oluşturuyor, bu planı doğruluyor ve ancak ondan sonra çalıştırıyor. 300 farklı görevde yapılan testlerde sistem %88-100 arası başarı oranları elde etti. Bu yaklaşım özellikle SQL veritabanı işlemleri ve çok aşamalı yapılandırılmış görevlerde yapay zeka güvenilirliğini önemli ölçüde artırabileceğini gösteriyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Robotlara Modüler Yetenekler Kazandıran Yeni Sözleşme Sistemi Geliştirildi

Araştırmacılar, fiziksel robotların yeteneklerini modüler bir şekilde yönetmek için ECM Contracts adlı yeni bir arayüz modeli geliştirdi. Bu sistem, robotların farklı yetenekleri kurması, güncellemesi ve birleştirmesi sürecini standartlaştırıyor. Geleneksel yazılım arayüzlerinin aksine, ECM Contracts altı farklı boyutu dikkate alarak robotların güvenli ve uyumlu çalışmasını sağlıyor. Bu yaklaşım, robot yeteneklerinin karmaşık kombinasyonlarının güvenilir bir şekilde çalışmasını mümkün kılarak, robotik sistemlerde modülerlik ve uyumluluk sorunlarına çözüm getiriyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Şehir Trafiğini İnsan Mantığıyla Yönetmeyi Öğreniyor

Araştırmacılar, şehir trafiğini daha akıllı yönetebilmek için yeni bir yapay zeka sistemi geliştirdi. C2T adlı bu sistem, büyük dil modellerinden 'sağduyu' bilgisini öğrenerek trafik ışıklarını ve otonom araçları koordine ediyor. Geleneksel sistemler sadece kavşak yoğunluğu gibi basit metriklere odaklanırken, yeni sistem güvenlik, trafik akışının istikrarı ve sürüş konforu gibi insan odaklı hedefleri de göz önünde bulunduruyor. Çoklu kavşaklarda yapılan testlerde, mevcut en iyi yöntemlere kıyasla trafik verimliliği ve güvenlikte önemli iyileştirmeler sağlandı.

arXiv (CS + AI) · 29 gün önce

← 1 … 150 151 152 153 154 … 156 →