"program doğrulama" araması

Arama Sonuçları

173 haber

Siber güvenlik AI ajanları: Hangi mimariler gerçekten işe yarıyor?

Yapay zeka tabanlı siber güvenlik sistemleri, canlı hedefleri denetlemek için araç kullanan büyük dil modellerini (LLM) kullanıyor. Ancak hangi ajan mimarilerinin en etkili olduğu belirsizdi. Yeni araştırma, 20 interaktif hedef üzerinde 600 test koşturarak farklı ajan mimarilerini karşılaştırdı. Sonuçlar, çok-ajanlı bağımsız sistemlerin (MAS-Indep) %64,2 doğrulama oranıyla en yüksek güvenlik açığı tespit performansını gösterdiğini ortaya koydu. Tek ajanlı sistemler ise maliyet etkinliği açısından öne çıktı. Beyaz kutu testlerin kara kutu testlerden belirgin şekilde üstün olduğu (%67'ye karşı %32,7) da dikkat çeken bulgular arasında. Bu çalışma, siber güvenlik alanında AI ajan topologylerinin optimize edilmesi için somut veriler sunuyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Güvenlik Sistemlerindeki 'Gevşetme' Yaklaşımının Gizli Maliyeti

Yapay sinir ağlarının güvenilirliğini test eden doğrulama sistemleri, performans artışı için 'konveks gevşetme' yöntemini kullanıyor. Bu yaklaşım, karmaşık tamsayı kısıtlamalarını basitleştirerek hesaplama süresini kısaltıyor ancak sistemin doğruluğunu tehlikeye atıyor. Araştırmacılar, orijinal sinir ağı ile gevşetilmiş versiyonu arasındaki sapmanın ağın derinliğiyle üstel olarak arttığını matematiksel olarak kanıtladı. Bu bulgu, AI güvenlik sistemlerinde hız ile doğruluk arasındaki kritik dengeyi gözler önüne seriyor ve gelecekteki doğrulama algoritmalarının tasarımında önemli bir kılavuz sunuyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Hindi Haber Doğrulama: Yapay Zeka Dezenformasyonla Savaşacak

Araştırmacılar, Hindi dilinde yayılan dezenformasyonla mücadele etmek için yenilikçi bir yapay zeka sistemi geliştirdi. Direct Preference Optimization (DPO) ve müfredat öğrenmesi teknikleriyle çalışan bu sistem, makine tarafından üretilen açıklamaları insan mantığıyla uyumlu hale getiriyor. Hindi gibi kaynak azlığı yaşanan diller için özel olarak tasarlanan framework, güvenilir kaynaklardan alınan doğru bilgileri tercih edilen yanıtlar olarak kullanırken, yetersiz sistem çıktılarını da öğrenme materyali haline getiriyor. Mistral, Llama ve Gemma gibi büyük dil modelleriyle yapılan testler, sistemin tutarlı ve bağlama uygun açıklamalar üretebileceğini kanıtladı. Bu gelişme, küresel çapta artan dezenformasyon tehdidine karşı önemli bir adım.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Karşıt Argümanlarla İçerik Denetimini Güçlendiriyor

Sosyal medya platformlarında yanlış bilginin yayılması büyük endişe yaratırken, X'in Topluluk Notları gibi kitle kaynaklı doğruluk kontrolü sistemleri öne çıkıyor. Ancak bu sistemler partizan önyargı ve doğrulama gecikmeleri gibi sorunlarla karşılaşıyor. Yeni bir araştırma, yapay zekanın destekleyici, nötr veya karşıt argümanlar sunarak içerik denetimini nasıl iyileştirebileceğini inceliyor. Sonuçlar, özellikle karşıt görüşlerin sunulduğu geri bildirimlerin not kalitesini en çok artırdığını gösteriyor. Bu bulgular, farklı bakış açılarının ve insan-yapay zeka iş birliğinin kolektif zekanın geliştirilmesindeki önemini vurguluyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Ajanları Tablo Verilerindeki Yanlış Bilgileri Tespit Ediyor

Araştırmacılar, tablo halindeki verilerden yapılan iddiaların doğruluğunu kontrol etmek için yeni bir yapay zeka sistemi geliştirdi. MACE adlı sistem, üç özel ajan kullanarak dezenformasyonla mücadele ediyor. Planlayıcı ajan doğrulama stratejisini belirliyor, Uygulayıcı ajan hesaplamaları yapıyor, Doğrulayıcı ajan ise mantıksal tutarlılığı kontrol ediyor. Sistem, karmaşık eğitim süreçlerine ihtiyaç duymadan çalışıyor ve her adımda açıklanabilir sonuçlar üretiyor. Test edilen dört veri setinden ikisinde en iyi performansı sergileyen sistem, diğer ikisinde de mevcut en iyi modellerle eşdeğer başarı gösterdi.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

DynaFix: Kod Hatalarını İnsanlar Gibi Adım Adım Düzelten Yapay Zeka

Araştırmacılar, yazılımlardaki hataları otomatik olarak düzelten yeni bir yapay zeka sistemi geliştirdi. DynaFix adlı bu sistem, geleneksel yaklaşımlardan farklı olarak programların çalışma anındaki davranışlarını analiz ederek, tıpkı deneyimli bir programcının yaptığı gibi adım adım hata ayıklama yapabiliyor. Mevcut sistemler çoğunlukla kodun statik analizine odaklanırken, DynaFix programın gerçek zamanlı çalışma verilerini kullanarak daha etkili çözümler üretiyor. Bu yaklaşım, karmaşık yazılım hatalarının çözümünde önemli bir ilerleme vaat ediyor ve yazılım geliştirme süreçlerini hızlandırabilir.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

AI Modelleri Artık Kablosuz Ağ Kalitesine Göre Akıllıca Karar Verebilecek

Araştırmacılar, büyük dil modellerinin (LLM) cihaz ve kenar sunucu arasında dağıtık çalışmasını iyileştiren yenilikçi bir yöntem geliştirdi. WISV adlı bu sistem, geleneksel kelime bazlı doğrulama yerine anlamsal değerlendirme kullanarak kablosuz bağlantı kalitesini dikkate alıyor. Sistem, anlık kanal durumu bilgilerini AI modelinin gizli katmanlarındaki yüksek boyutlu verilerle birleştirerek daha akıllı kararlar veriyor. Bu yaklaşım, değişken kablosuz koşullarda daha uzun kabul edilen diziler ve daha az etkileşim turu ile performansı artırıyor. Çalışma, edge computing ve 5G/6G ağlarının yaygınlaşmasıyla birlikte AI uygulamalarının daha verimli çalışması için önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Tabanlı Borsa Danışmanları Gerçekten İşe Yarıyor mu?

Araştırmacılar, çoklu yapay zeka ajanlarından oluşan MarketSenseAI sisteminin borsa performansını inceledi. Sistem, haber analizi, temel analiz, piyasa dinamikleri ve makroekonomik veriler üzerinde uzmanlaşmış dört farklı AI ajanını kullanıyor. S&P 500'de 19 aylık test döneminde sistem, aylık ortalama %2,18 getiri sağlayarak pasif yatırım stratejilerini %1,03 puan geride bıraktı. 10.000 rastgele portföy simülasyonunda %99,7'lik dilime yerleşen bu başarı istatistiksel olarak anlamlı bulundu. Araştırma, yapay zeka destekli yatırım önerilerinin tesadüften ziyade gerçek bir değer kattığını gösteren ilk kapsamlı portföy düzeyindeki doğrulama çalışması.

arXiv (CS + AI) · 25 gün önce

Fizik

Yapay Zeka Kuantum Mekaniği Sorunlarını Çözmeyi Öğreniyor

Stanford ve MIT araştırmacıları, büyük dil modellerinin kuantum mekaniği gibi karmaşık fizik alanlarında daha güvenilir sonuçlar üretmesi için yeni bir yöntem geliştirdi. QuantumQA adlı büyük ölçekli veri seti ve doğrulama temelli ödül sistemi kullanan bu yaklaşım, yapay zekanın bilimsel muhakeme yeteneklerini önemli ölçüde artırıyor. Geleneksel AI modellerinin fizik yasalarına uygun cevaplar vermekte zorlandığı biliniyordu. Yeni sistem, deterministik çözücülerle anlambilimsel değerlendirmeyi birleştirerek bilimsel doğruluğu garanti altına alıyor. Bu gelişme, AI'nin eğitim, araştırma ve bilimsel keşifler için kullanımını devrimselleştirebilir.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Açıklamalarının Güvenilirliği Artırıldı

Büyük dil modelleri ikna edici açıklamalar üretse de, bu açıklamaların doğruluğunu kontrol etmek zordu. Araştırmacılar, yapay zekanın verdiği cevapların kaynaklarına dayalı olup olmadığını ölçen yeni bir sistem geliştirdi. Programlama eğitimi alanında yapılan deneylerde, standart RAG sistemlerinin kaynak uyumunun %22-40 arasında kaldığı, ancak yeni yaklaşımla bu oranın önemli ölçüde artırılabildiği görüldü. Bu gelişme, özellikle eğitim ve bilimsel alanlarda yapay zekanın daha güvenilir açıklamalar üretmesini sağlayabilir.

arXiv (CS + AI) · 25 gün önce

Teknoloji & Yapay Zeka

Yazılım 'şişkinliğini' azaltmanın yeni yolu: Gerçek performans ölçümü

Yazılım geliştirme dünyasında 'debloating' olarak bilinen süreç, programlardan kullanılmayan kodları temizleyerek performansı artırmayı hedefliyor. Ancak bu alandaki mevcut değerlendirme yöntemleri eksik kalıyor. Araştırmacılar, test senaryoları ve kod boyutu gibi dolaylı ölçütler yerine, gerçek performans verilerine dayanan yeni bir değerlendirme yaklaşımı geliştirdi. Bu çalışma, yazılım optimizasyonu alanında daha güvenilir standartlar oluşturma ihtiyacını vurguluyor ve sekiz farklı debloating tekniğini analiz ederek alandaki boşlukları ortaya koyuyor.

arXiv (CS + AI) · 25 gün önce

← 1 … 3 4 5 6 7 … 15 →