"grup testleri" için 291 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
291 haber
Büyük Dil Modelleri Siber Güvenlik Testlerinde Sınırlarını Zorladı
Araştırmacılar, 7 farklı şirketten 10 büyük dil modelini siber güvenlik saldırı görevlerinde test etti. NYU'nun 200 zorlu siber güvenlik problemini çözen bu modeller arasında Claude 4.5 Opus %59 başarı oranıyla öne çıktı. Çalışma, yapay zeka sistemlerinin penetrasyon testleri ve siber güvenlik açığı keşfinde ne kadar etkili olduğunu gösterdi. Özel olarak hazırlanan Kali Linux ortamında 100'den fazla güvenlik aracı kullanılan testlerde, modellerin siber saldırı senaryolarını çözme kabiliyetleri ölçüldü. Bu araştırma, AI'nın siber güvenlik alanındaki potansiyelini ve risklerini anlamamız açısından kritik veriler sunuyor.
arXiv (CS + AI) · 25 gün önce
0
Matematikçiler Grup Teorisinde Yeni Ayrılabilirlik Koşulları Keşfetti
Araştırmacılar, serbest çarpım gruplarında alt grupların alternating ve simetrik gruplara ayrılabilirliği konusunda yeni teorik sonuçlar elde etti. Bu çalışma, bir serbest grup F ile LERF özelliği gösteren bir grup G'nin serbest çarpımında, belirli alt grupların alternating veya simetrik gruplara nasıl ayrılabileceğine dair yeterli koşulları ortaya koyuyor. Özellikle, serbest bir grubun sonlu üretilmiş ve sonsuz indeksli herhangi bir alt grubunun, serbest grup ile herhangi bir LERF grubunun serbest çarpımında alternating-simetrik ayrılabilir olduğu kanıtlandı. Bu bulgu, Wilton'ın daha önceki bir sonucunu genelleştiriyor ve grup teorisinin temel yapı taşları arasındaki ilişkileri daha iyi anlamamızı sağlıyor.
arXiv (Matematik) · 25 gün önce
0
Yapay Zeka Kodlama Modelleri Karşılaştırması: Gerçek Uygulamada Beklenmedik Sonuçlar
Araştırmacılar, beş farklı açık kaynak kodlama yapay zekası modelini React Native mobil uygulama geliştirme görevinde test etti. Çalışmada Kimi-K2.5, GLM-5.1, Qwen3-Coder-480B ve DeepSeek-V3.2 modelleri NVIDIA GH200 donanımında karşılaştırıldı. Şaşırtıcı şekilde, teorik performans sıralamaları gerçek dünya görevlerindeki başarıyı öngöremedi. En düşük kaliteli sıkıştırmaya sahip Kimi-K2.5 modeli, SWE-Bench testlerinde daha yüksek puan alan rakiplerini geride bırakarak en eksiksiz ve kurallara uygun kodu üretti. Araştırma, yapay zeka kodlama araçlarının değerlendirilmesinde laboratuvar testleri ile gerçek dünya performansı arasındaki önemli farkları ortaya koyuyor.
arXiv (CS + AI) · 25 gün önce
0
Yapay Zeka Modellerinde Belirsizlik Ölçümü için Yeni Durdurma Kuralı Geliştirildi
Araştırmacılar, derin öğrenme modellerinde belirsizlik tahminini iyileştiren Bayesci Derin Topluluklarının (BDE) eğitim süresini optimize etmek için E-değer tabanlı yeni bir yöntem geliştirdi. Bu yaklaşım, pahalı örnekleme işleminin ne zaman durdurulması gerektiğini istatistiksel hipotez testleriyle belirliyor. Derin öğrenme modellerinin güvenilirlik ölçümü kritik uygulamalarda hayati önem taşırken, mevcut yöntemler hesaplama maliyeti açısından zorlayıcı olabiliyor. Yeni teknik, model performansında anlamlı iyileşme olmadığında eğitimi otomatik olarak sonlandırarak hem zaman hem de kaynak tasarrufu sağlıyor. Bu gelişme, özellikle sağlık ve otonom sistemler gibi güvenilirlik gerektiren alanlarda yapay zeka modellerinin daha etkin kullanımına olanak tanıyacak.
arXiv (CS + AI) · 25 gün önce
0
Yapay zeka ağları artık topluluk sayısını tam kontrol edebilecek
Stanford araştırmacıları, graf sinir ağlarının en büyük problemlerinden birini çözdü. Bu AI sistemleri sosyal ağlardaki arkadaş gruplarından protein etkileşimlerine kadar pek çok alanda topluluk tespiti yapıyor, ancak şimdiye kadar kaç grup bulacaklarını tam olarak kontrol edemiyorlardı. Yeni geliştirilen yöntem, araştırmacıların hem kesin grup sayısı belirleyebilmesine hem de 'en az 3, en fazla 7 grup' gibi esnek aralıklar tanımlayabilmesine olanak sağlıyor. Bu breakthrough, sosyal medya analizinden biyomedikal araştırmalara kadar geniş bir yelpazede daha güvenilir sonuçlar elde edilmesini mümkün kılacak. Özellikle büyük veri setlerinde manuel kontrol imkansız olduğu için, bu gelişme yapay zekanın gerçek dünya problemlerinde daha etkili kullanılabilmesinin önünü açıyor.
arXiv (CS + AI) · 25 gün önce
0
Matematikçiler p-Divisible Grupların Sınıflandırılmasında Büyük İlerleme Kaydetti
Araştırmacılar, modern cebirin en karmaşık alanlarından biri olan p-divisible grupların teorisinde önemli bir başarı elde etti. Princeton Üniversitesi'nden matematikçiler, Vladimir Drinfeld'in iki önemli varsayımını ispatlayarak, bu matematiksel yapıların sınıflandırılması konusunda yeni bir yaklaşım geliştirdi. Çalışma, 'yığınsal prizmatik teknoloji' adı verilen son dönemde geliştirilmiş yenilikçi araçları kullanıyor. Bu başarı, sayılar teorisi ve cebirsel geometrinin kesişiminde yer alan p-adic sayılar üzerindeki grup yapılarının daha iyi anlaşılmasını sağlayacak. Araştırma, özellikle p-divisible grupların moduli uzaylarının geometrik özelliklerini açıklığa kavuşturuyor ve bu alandaki gelecek çalışmalar için sağlam bir temel oluşturuyor.
arXiv (Matematik) · 25 gün önce
0
Yapay Zeka Modelleri Artık Prolog ile Mantıksal Çıkarım Yapabiliyor
Araştırmacılar, dil modellerinin sıklıkla makul görünen ama yanlış mantık yürütme süreçleri üretme sorununun üstesinden gelmek için yenilikçi bir yaklaşım geliştirdi. Qwen2.5-3B-Instruct modeli, Prolog programlama dilini harici bir sembolik mantık aracı olarak kullanmak üzere eğitildi. Bu süreçte Group Relative Policy Optimization (GRPO) yöntemiyle pekiştirmeli öğrenme kullanıldı. Sonuçlar oldukça etkileyici: 3 milyar parametreli model, MMLU-STEM ve MMLU-Pro testlerinde 7 milyar parametreli modellerin performansına yakın başarı gösterdi. Ancak araştırma önemli bir ödünleşme ortaya çıkardı: sadece doğruluk için optimize edilen yapılandırmalar, mantık yürütmeyi doğal dile devredip Prolog'u sadece son hesaplama için kullanırken, diğer yapılandırmalar daha şeffaf mantık süreçleri üretiyor. Bu çalışma, AI sistemlerinin hem daha doğru hem de denetlenebilir olması yolunda önemli bir adım.
arXiv (CS + AI) · 25 gün önce
0
Matematikçiler Hareket Planlama Problemleri İçin Yeni Karmaşıklık Ölçüsü Geliştirdi
Matematik dünyasında yeni bir gelişme yaşandı. Araştırmacılar, robotların ve sistemlerin karmaşık ortamlarda hareket planlaması yapabilmesi için önemli bir matematiksel araç geliştirdi. 'İnvariant parametreli topolojik karmaşıklık' adı verilen bu yeni kavram, özellikle engellerin konumlarının bilinmediği durumlarda hareket planlama problemlerinin zorluk derecesini ölçebiliyor. Çalışma, daha önce geliştirilen 'invariant topolojik karmaşıklık' kavramını genişleterek, grup teorisi ve topoloji alanlarında önemli bir köprü kuruyor. Araştırmacılar, compact Lie gruplarının serbest etki ettiği uzaylarda bu yeni karmaşıklık ölçüsünün, orbit uzayları arasındaki fibrasyon için bilinen parametreli topolojik karmaşıklık ile aynı sonucu verdiğini kanıtladı. Bu teorik gelişme, robotik, kontrol teorisi ve hareket planlama alanlarında pratik uygulamalar bulabilecek matematik altyapısını güçlendiriyor.
arXiv (Matematik) · 25 gün önce
0
Yapay Zeka ile Endüstriyel Arızaların Şiddetini Tespit Eden Yeni Sistem
Araştırmacılar, akıllı üretimde kritik öneme sahip arıza şiddeti teşhisi için devrim niteliğinde bir yapay zeka sistemi geliştirdi. Geleneksel yöntemlerin aksine, bu sistem arıza türleri arasındaki hiyerarşik ilişkileri anlayabiliyor. Derin hiyerarşik bilgi kaybı adı verilen yenilikçi yaklaşım, ağaç yapısındaki sınıflandırma modelini kullanarak benzer özelliklere sahip arızaları grupluyor. Sistem, pozitif ve negatif hiyerarşik bilgi kısıtlamaları ile odaklanmış hiyerarşik ağaç kaybı teknikleri kullanıyor. Ayrıca, sınıflar arası yapısal sınır bilgilerini modellemek için dinamik marjinli grup ağacı triplet kaybı metodunu uyguluyor. Bu iki kayıp fonksiyonunun birleşimi sayesinde, sistem en hassas arızaları bile başarıyla tanımlayabiliyor. Kapsamlı deneyler, yöntemin mevcut teknolojilere kıyasla üstün performans sergilediğini kanıtlıyor.
arXiv (CS + AI) · 25 gün önce
0
Yapay Zeka Ajanları Güvenlik Tehdidi Olabilir: GrantBox ile Yeni Değerlendirme
Araştırmacılar, gerçek dünya araçlarına erişimi olan yapay zeka ajanlarının güvenlik risklerini değerlendirmek için GrantBox adlı yeni bir sistem geliştirdi. Bu çalışma, LLM tabanlı ajanların yetki kullanımlarının nasıl kötüye kullanılabileceğini ve bunun bilgi sızıntısı ile altyapı hasarı gibi ciddi sonuçlara yol açabileceğini ortaya koyuyor. Mevcut güvenlik testlerinin yapay ortamlarda yapıldığını belirten araştırmacılar, gerçek dünya koşullarında daha kapsamlı güvenlik değerlendirmeleri yapılması gerektiğini vurguluyor.
arXiv (CS + AI) · 25 gün önce
0
Yapay zeka özetleme sistemlerinin kalitesini ölçmede yeni yöntem
Araştırmacılar, yapay zeka sistemlerinin ürettiği metin özetlerinin kalitesini değerlendirmek için yeni bir yaklaşım geliştirdi. Mevcut değerlendirme yöntemleri genellikle büyük dil modellerine ihtiyaç duyuyor ve güvenilirlik sorunları yaşıyor. Yeni framework, referans özetlere veya pahalı model tabanlı ölçütlere ihtiyaç duymadan özetlerin tamlık, özlülük ve doğruluk gibi kalite boyutlarını değerlendirebiliyor. Araştırmada ayrıca 'grup izotonik regresyon binning' adı verilen bir kalibrasyon yöntemi öneriliyor. Bu yöntem, ham tahminleri gerçek değerlendirme ölçütleriyle daha iyi uyumlu hale getiriyor. Sürekli değerli görevler olan özetleme için odaklanılsa da, yöntem soru-cevap gibi ayrık değerli görevlerde de uygulanabiliyor. Bu gelişme, yapay zeka sistemlerinin ürettiği içeriklerin kalitesinin daha güvenilir şekilde ölçülmesine olanak tanıyor.
arXiv (CS + AI) · 25 gün önce
0