"ajan değerlendirme" için 676 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
676 haber
Siber Saldırılara Dayanıklı Robot Sürüleri İçin Yeni Kontrol Sistemi
Araştırmacılar, birbirleriyle iletişim kuran robot sistemlerinin siber saldırılara karşı dayanıklılığını artıran yeni bir kontrol yöntemi geliştirdi. Çoklu ajan sistemleri olarak bilinen bu robot sürülerinde, hizmet reddi (DoS) saldırıları iletişimi kesintiye uğratarak sistemin başarısızlığına neden olabilir. Yeni yaklaşım, sabit zamanda işleyen ve mevcut sistemlerin aksine güçlü bağlantılılık gerektirmeyen dağıtık bir kontrol mekanizması sunuyor. Sistem, başlangıç durumlarından bağımsız olarak belirli bir süre içinde hedefine ulaşmayı garanti ediyor. Bu gelişme, otonom araç filosundan drone sürülerine kadar pek çok alanda güvenlik açısından kritik uygulamalar için önemli.
arXiv (CS + AI) · 29 gün önce
0
Difüzyon Dil Modellerinde Öngörü Kararsızlığının Gizli Yüzü Ortaya Çıktı
Yapay zeka alanında yeni nesil büyük dil modelleri olan difüzyon dil modellerinin (DLM) beklenmedik bir sorunu keşfedildi. Araştırmacılar, bu modellerin aynı soruya farklı zamanlarda verdikleri yanıtların tutarsız olabildiğini, ancak geleneksel değerlendirme yöntemlerinin bu kararsızlığı maskelediğini ortaya koydu. Mevcut test sistemleri, binlerce örneğin ortalamasına bakarak modelin genel performansını ölçüyor, böylece bireysel örneklerdeki büyük farklılıklar gözden kaçıyor. Bu durum, aynı genel performansa sahip iki model konfigürasyonunun, tekil sorularda tamamen farklı davranabilmesi anlamına geliyor. Araştırma ekibi, her bir örneği ayrı ayrı inceleyerek modellerin ne kadar tutarsız olduğunu daha detaylı ölçen yeni bir değerlendirme sistemi geliştirdi.
arXiv (CS + AI) · 29 gün önce
0
Yapay zeka ile tablo anlayan yeni sistem: TableNet veri seti tanıtıldı
Araştırmacılar, büyük dil modellerinin (LLM) tablo yapısını daha iyi anlaması için TableNet adlı yeni bir veri seti geliştirdi. Mevcut veri setlerinin yetersizliği nedeniyle LLM'lerin karmaşık tablo düzenlerini analiz etmede zorlandığı problemi çözmek amacıyla tasarlanan sistem, otonom tablo üretimi ve tanıma teknolojilerini birleştiriyor. Geliştirilen çok-ajan sistem, görsel, yapısal ve semantik parametreleri kontrol edebilen bir yaklaşımla çeşitli tablo görüntüleri oluşturabiliyor. Bu yenilik, yapay zekanın belgelerdeki tabloları daha doğru şekilde yorumlamasını sağlayarak, veri analizi ve belge işleme alanlarında önemli ilerlemeler vaat ediyor. Sistem kullanıcı tanımlı konfigürasyonlarla uyumlu çalışarak, büyük ölçekli veri seti oluşturulmasına imkan tanıyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka ile Dezenformasyonla Mücadele: Yeni Simülasyon Modeli Geliştirildi
Sosyal medyada yanlış bilgi yayılımı günümüzün en büyük sorunlarından biri haline geldi. Araştırmacılar, bu soruna karşı etkili stratejiler geliştirmek için yapay zeka ve simülasyon teknolojilerini birleştiren yenilikçi bir yaklaşım geliştirdi. Çalışmada, derin pekiştirmeli öğrenme algoritmaları ile ajan tabanlı simülasyon modelleri entegre edilerek, sahte haberlerin yayılma dinamikleri ve bunlara karşı geliştirilen önleme stratejilerinin etkinliği analiz ediliyor. Bu hibrit yaklaşım, hem veri odaklı hem de model odaklı araştırma yöntemlerinin güçlü yanlarını birleştirerek, dezenformasyon ile mücadelede daha bilimsel temelli çözümler sunuyor.
arXiv (CS + AI) · 29 gün önce
0
Sahte yorumlar nasıl tüm sistemi ele geçirebiliyor?
Araştırmacılar, tek bir kötü niyetli kullanıcının online değerlendirme sistemlerini nasıl manipüle edebileceğini inceledi. Çalışma, popülerlik tabanlı derecelendirme sistemlerinin zayıflıklarını ortaya koyuyor. Bulgulara göre, az sayıda stratejik saldırı, geniş çaplı saldırılardan çok daha etkili olabiliyor. Kötü niyetli kullanıcılar, düşük kaliteli ürünleri öne çıkarırken yüksek kaliteli olanları bastırarak sistemin güvenilirliğini ciddi şekilde sarsabiliyor. Araştırma, kullanıcıların farklı davranış kalıplarının bu tür saldırıları nasıl etkileyebileceğini de araştırıyor.
arXiv (CS + AI) · 29 gün önce
0
İş dünyası için yapay zeka değerlendirme platformu WorkRB geliştirildi
Günümüzde işe alım süreçleri, yetenek yönetimi ve işgücü analitiği giderek daha fazla yapay zeka destekli öneri sistemlerine dayanıyor. Ancak bu alandaki araştırmalar dağınık ve karşılaştırma yapmak zorlaşıyor. Farklı sınıflandırma sistemleri, çeşitli görev tanımları ve model yaklaşımları kullanılması, çalışmaları birbiriyle kıyaslanabilir olmaktan çıkarıyor. Araştırmacılar, bu soruna çözüm olarak WorkRB adında açık kaynaklı bir değerlendirme platformu geliştirdi. Platform, iş alanına özel yapay zeka uygulamalarını test etmek için özel olarak tasarlandı ve topluluk odaklı bir yaklaşım benimsiyor. Bu çalışma, sektördeki parçalanmışlık sorununa çözüm getirerek, yapay zeka teknolojilerinin iş dünyasındaki performansını daha objektif şekilde değerlendirme imkanı sunuyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Mobil Bankacılık Uygulamalarını Değerlendiriyor
Bangladeş'te yapılan yeni bir araştırma, mobil bankacılık uygulamalarının kullanıcı yorumlarını analiz etmek için farklı yapay zeka modellerini karşılaştırdı. Çalışma, gelişmekte olan ülkelerde milyonlarca kişinin finansal hizmetlere erişimde kullandığı mobil bankacılık uygulamalarının kalitesini ölçmeye odaklandı. Araştırmacılar, 11.414 ham yorumdan filtreledikleri 5.652 İngilizce ve Bengalce Google Play yorumunu inceleyerek, geleneksel makine öğrenmesi modellerinin transformer tabanlı yapay zeka modellerinden daha başarılı olduğunu keşfetti. Bu bulgular, finansal teknoloji uygulamalarının kullanıcı memnuniyetini değerlendirmede hangi analiz yöntemlerinin daha etkili olduğuna dair önemli ipuçları sunuyor.
arXiv (CS + AI) · 29 gün önce
0
Korece Yapay Zeka Modelleri Yerel Kültürde Zorlanıyor
Güney Koreli araştırmacılar, yapay zeka modellerinin Korece dilinde ve kültürel bağlamda ne kadar başarılı olduğunu ölçmek için KMMMU adlı yeni bir test sistemi geliştirdi. 3.466 sorudan oluşan bu kapsamlı değerlendirme, matematik, fen bilimleri ve sosyal bilimler gibi dokuz farklı alandaki görselli soruları içeriyor. Test sonuçları oldukça düşündürücü: en güçlü açık kaynak yapay zeka modeli bile sadece %42 başarı gösterirken, ticari modellerin en iyisi zor sorularda %52'ye ulaşabildi. Özellikle Kore kültürüne özgü sorularda performans %13'e varan düşüşler gösterdi. Bu çalışma, yapay zeka modellerinin küresel ölçekte geliştirilmesine rağmen yerel kültür ve dil özelliklerinde hala ciddi eksiklikleri olduğunu ortaya koyuyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay zeka modellerinde yeni güvenlik sistemi: Çift yönlü tahmin yetisi
Bilim insanları, büyük dil modellerinin (LLM) gerçek zamanlı güvenilirliğini izlemek için yeni bir yöntem geliştirdi. 'Çift yönlü tahmin yetisi' adı verilen bu sistem, modellerin çok turlu konuşmalardaki bütünlüğünü anlık olarak kontrol edebiliyor. Mevcut değerlendirme yöntemleri ya sonradan analiz gerektiriyor ya da tek yönlü güven ölçümleri kullanıyor. Yeni sistem ise ham token istatistiklerinden yola çıkarak, modelin etkileşim yapısının sağlam kalıp kalmadığını gerçek zamanlı olarak izliyor. Araştırmacılar ayrıca 'Bilgi Dijital İkizi' adında hafif bir mimari geliştirerek bu ölçümü pratik hale getirdi. Bu yaklaşım, yüksek riskli otonom sistemlerde çalışan yapay zeka modellerinin fark edilmeden bozulmasını önleyebilir.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Doğru Düşünüyor Ama Yanlış Sonuca Varıyor
Araştırmacılar büyük dil modellerinin mantıksal adımları doğru şekilde izleyip yanlış sonuca vardığını keşfetti. Geliştirilen Novel Operator Test, modellerin gerçek mantık yürütme ile örüntü ezberleme arasındaki farkı ortaya çıkarıyor. Claude Sonnet gibi gelişmiş modeller bile derinlemesine mantık zincirlerinde sistematik hatalar yapıyor. Bu bulgular, AI sistemlerinin düşünme sürecinin çıktılarından farklı işlediğini gösteriyor ve mevcut değerlendirme yöntemlerinin yetersizliğini ortaya koyuyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Sesli Asistanlarda Aksana ve Cinsiyete Dayalı Önyargı Tespit Edildi
Araştırmacılar, sesli yapay zeka sistemlerinin kullanıcıların aksanına ve seslerinin cinsiyet algısına göre farklı davranış sergilediğini keşfetti. Çalışmada altı farklı aksan ve iki cinsiyet sunumu üzerinden yapılan testler, AI'ların belirli ses özelliklerine sahip kullanıcılara daha düşük kaliteli yanıtlar verdiğini ortaya koydu. İnteraktif değerlendirme yöntemiyle yapılan araştırma, ses dönüştürme teknolojisinin kullanıcıların bu önyargıları fark etmesine nasıl yardımcı olabileceğini de inceledi. Bulgular, sesli AI sistemlerinde adalet ve eşitlik açısından önemli sorunlara işaret ediyor.
arXiv (CS + AI) · 29 gün önce
0