"matrix attention" için 44 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
44 haber
Türbülans Simülasyonlarını Hızlandıran Yapay Zeka Destekli Yazılım Paketi
Araştırmacılar, türbülanslı akış simülasyonlarını önemli ölçüde hızlandıran yeni bir açık kaynak yazılım paketi geliştirdi. IncompressibleNavierStokes.jl adlı bu Julia paketi, GPU ve CPU'larda eşzamanlı çalışabilen matrix-free çekirdekler kullanarak sıkışmayan Navier-Stokes denklemlerini çözüyor. Yazılımın en dikkat çekici özelliği, yapay sinir ağı modellerinin doğrudan simülasyon içine gömülebilmesi. Bu sayede türbülans modellemesi için neural network kapanış modelleri eğitilebiliyor. Yazılım, tek bir GPU üzerinde 840³ çözünürlüğe kadar doğrudan sayısal simülasyonlar gerçekleştirebiliyor. Geliştirilen sistem, türbülanslı kanal akışı testlerinde referans verilerle başarıyla doğrulandı. Bu gelişme, hesamalı akışkanlar dinamiği alanında yapay zekanın entegrasyonu açısından önemli bir adım olarak değerlendiriliyor.
arXiv (CS + AI) · 24 gün önce
0
Matrix: Yapay Veri Üretiminde Merkezi Otoritesiz Yeni Çığır
Büyük dil modellerinin eğitimi için yapay veri üretimi giderek kritik hale gelirken, mevcut sistemlerin merkezi yapısı ölçeklenebilirlik sorunları yaratıyor. Araştırmacılar, bu sorunu çözmek için Matrix adlı yeni bir framework geliştirdi. Bu sistem, merkezi bir orkestratör olmadan çalışan, eşler arası (peer-to-peer) mimaride yapay veri üreten çok ajanlı bir yapı sunuyor. Her ajanın bağımsız çalıştığı bu sistemde, kontrol ve veri akışı dağıtık kuyruklarla sağlanıyor. Matrix'in en önemli avantajı, farklı domainlere uyum sağlayabilmesi ve ölçeklenebilirlik darboğazlarını ortadan kaldırması. Gerçek verinin kıt, pahalı veya gizlilik hassasiyeti bulunan durumlarda bu tür sistemler, AI modellerinin gelişimi için hayati önem taşıyor.
arXiv (CS + AI) · 24 gün önce
0
ViT³: Yapay Zeka Görüntü İşlemede Test Anında Öğrenme Devri
Araştırmacılar, yapay zeka görüntü işlemede yeni bir yaklaşım olan Test-Time Training (TTT) metodunu geliştirdi. Bu yenilikçi teknik, geleneksel attention mekanizmalarını test anında çalışan bir öğrenme sistemine dönüştürüyor. ViT³ adı verilen model, görüntü verilerini işlerken anlık olarak kendini optimize edebiliyor ve lineer hesaplama karmaşıklığı sunuyor. Klasik modellerin aksine, bu sistem test sırasında gelen her yeni veriyle birlikte performansını artırabiliyor. Altı temel tasarım ilkesine dayanan bu yaklaşım, görsel dizileri işlemede önemli verimlilik kazanımları sağlıyor. Gelecekte bu teknoloji, gerçek zamanlı görüntü analizi, otonom araçlar ve medikal görüntüleme gibi alanlarda devrim yaratabilir.
arXiv (CS + AI) · 24 gün önce
0
Vision Transformer'ların Karar Verme Sürecini Açıklayan Yeni Yöntem Geliştirildi
Bilgisayar görme alanında önemli başarılar elde eden Vision Transformer'lar, karmaşık yapıları nedeniyle nasıl karar verdikleri anlaşılması zor sistemlerdi. Araştırmacılar, bu yapay zeka modellerinin karar verme süreçlerini daha net anlaşılabilir hale getiren Decision-Aware Attention Propagation (DAP) adlı yeni bir yöntem geliştirdi. Bu yaklaşım, modelin dikkat mekanizmasına karar odaklı bilgileri entegre ederek, hangi görsel öğelerin sınıflandırma kararında etkili olduğunu daha açık şekilde gösteriyor. Yöntem, mevcut dikkat tabanlı açıklama yöntemlerinin sınırlılıklarını aşarak, sınıf ayırım kabiliyeti daha yüksek açıklamalar sunuyor.
arXiv (CS + AI) · 24 gün önce
0
Yapay Zeka Modelleri DASH ile 10 Kat Daha Hızlı Çalışabilir
Büyük dil modelleri ve multimodal yapay zeka sistemleri, uzun metinleri işlerken ciddi hız sorunları yaşıyor. Stanford araştırmacıları, bu soruna yenilikçi bir çözüm geliştirdi: Delta Attention Selective Halting (DASH). Bu yöntem, tokenların belirli bir noktadan sonra 'anlamsal sabitlenme noktalarına' ulaştığını gözlemleyerek gereksiz işlemleri durduruyor. DASH, herhangi bir ek eğitim gerektirmeden modellerin hızını önemli ölçüde artırırken doğruluklarını koruyor. FlashAttention gibi donanım optimizasyonlarıyla uyumlu çalışan bu teknoloji, hem dil hem de görsel görevlerde başarılı sonuçlar veriyor.
arXiv (CS + AI) · 24 gün önce
0
Yapay Zeka Polen Tanıma Sisteminde Çığır Açtı: 6 Kat Hızlı Analiz
Geleneksel polen analizi, bal kalitesini belirlemede kritik öneme sahip ancak uzman bir analisti 4-6 saat meşgul eden yorucu bir süreçti. Şili'deki araştırmacılar, bu sorunu çözmek için gelişmiş yapay zeka teknolojilerini birleştiren otomatik bir sistem geliştirdi. U²-Net tabanlı nesne tespiti ve DINOv2 Vision Transformer mimarisi kullanan sistem, polen taneciklerini %95.8 doğrulukla sınıflandırırken analiz süresini altıda birine indiriyor. Gradient-Weighted Attention teknolojisi sayesinde sistem, uzmanların anlayabileceği görsel açıklamalar da üretiyor. Bu gelişme, melissopalinoloji alanında devrim yaratabilecek nitelikte.
arXiv (Fizik) · 24 gün önce
0
Yapay Zeka Moleküllerdeki Uzak Mesafe Etkileşimleri Çözmeyi Başardı
Google DeepMind, BIFOLD ve Berlin Teknik Üniversitesi araştırmacıları, karmaşık moleküllerdeki atomlar arası uzun mesafe etkileşimlerini daha verimli şekilde modelleyebilen yeni bir yapay zeka yöntemi geliştirdi. Euclidean Fast Attention (EFA) adı verilen bu makine öğrenmesi yaklaşımı, kimyasal sistemlerdeki küresel atom etkileşimlerini daha hızlı ve doğru şekilde temsil edebiliyor. Bu gelişme, ilaç geliştirme süreçlerinde hızlanma, daha verimli batarya teknolojileri ve sürdürülebilir malzeme tasarımında önemli ilerlemeler sağlayabilir. Yöntem, özellikle karmaşık moleküler yapıların simülasyonunda geleneksel hesaplama yöntemlerinin sınırlarını aşmayı hedefliyor.
Phys.org · 24 gün önce
0
Yapay Zeka Kararlarını Açıklama: Üç Farklı Yöntemin Karşılaştırması
Büyük dil modelleri pek çok alanda başarılı sonuçlar verse de, nasıl karar verdikleri hala bir muamma. Araştırmacılar, yapay zekanın kararlarını anlaşılır hale getirmek için üç farklı açıklanabilirlik tekniğini karşılaştırdı. DistilBERT modeli üzerinde yapılan çalışmada Integrated Gradients, Attention Rollout ve SHAP yöntemleri test edildi. Sonuçlar, gradyan tabanlı yöntemlerin daha kararlı ve sezgisel açıklamalar sunduğunu gösterdi. Bu tür çalışmalar, yapay zekanın güvenilir şekilde kullanılabilmesi için kritik öneme sahip.
arXiv (CS + AI) · 25 gün önce
0
OmniShow: Metin, ses ve görüntüden gerçekçi insan-nesne etkileşim videoları üretiyor
Araştırmacılar, metin açıklaması, referans görüntüler, ses ve vücut pozları gibi farklı veri türlerini birleştirerek gerçekçi insan-nesne etkileşim videoları üreten OmniShow adlı yeni bir yapay zeka sistemi geliştirdi. Bu teknoloji, e-ticaret tanıtımları, kısa video üretimi ve etkileşimli eğlence içerikleri için otomatik içerik oluşturma konusunda önemli pratik değere sahip. Sistem, farklı koşulları uyumlu şekilde işleyerek endüstri seviyesinde performans sunuyor. Geliştirilen Unified Channel-wise Conditioning tekniği verimli görüntü ve poz enjeksiyonu sağlarken, Gated Local-Context Attention özelliği ses-görüntü senkronizasyonunu hassas şekilde gerçekleştiriyor.
arXiv (CS + AI) · 25 gün önce
0
Vision Transformer'larda Token Budama İçin Yeni Dikkat Mekanizması Geliştirildi
Araştırmacılar, Vision Transformer (ViT) modellerinde token budama işlemlerinin performans sorunlarını çözen yeni bir dikkat mekanizması geliştirdi. Token budama, önemsiz görüntü parçalarını atarak hesaplama maliyetini teorik olarak büyük ölçüde azaltsa da, pratikte mevcut değişken uzunluklu dikkat API'leri bu avantajı tam olarak yansıtamıyordu. Yeni geliştirilen 'dispatch-aware ragged attention' yöntemi, kısa sekans uzunluklarında ortaya çıkan dispatch-overhead darboğazını çözerek, budanmış ViT'lerin gerçek dünya performansını teorik potansiyellerine yaklaştırıyor. Bu çalışma, yapay zeka modellerinin hem doğruluk hem de hız açısından optimizasyonunda önemli bir adım teşkil ediyor.
arXiv (CS + AI) · 25 gün önce
0
Polinom sinir ağları için yeni güvenlik doğrulama yöntemi geliştirildi
Araştırmacılar, polinom sinir ağlarının güvenilirliğini test etmek için matematiksel geometri tabanlı yeni bir yöntem geliştirdi. Çalışmada, yapay sinir ağlarının saldırılara karşı dayanıklılığını ölçmek için öklid mesafesi derecesi kullanılıyor. Bu yöntem, ağın karar sınırlarına olan mesafeyi hesaplayarak güvenlik yarıçapını belirliyor. Geliştirilen sembolik eliminasyon ve homotopi-devam yöntemleri, sinir ağlarının tam güvenlik sertifikasyonunu mümkün kılıyor. Lightning self-attention modülleri üzerinde yapılan deneyler, karar sınırlarının beklenenden daha düşük karmaşıklığa sahip olduğunu gösteriyor.
arXiv (CS + AI) · 25 gün önce
0