"GPU" için 61 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
61 haber
Yapay Zeka ile Graf Analizi: Büyük Veri Setlerinde Alt Grafları Bulma Sorunu Çözüldü
Araştırmacılar, büyük ölçekli graf verilerinde alt graf eşleştirmesi problemini çözmek için yenilikçi bir yapay zeka yaklaşımı geliştirdi. Graf Sinir Ağları tabanlı bu yöntem, sosyal ağlardan biyolojik moleküllere kadar geniş bir alanda kullanılabiliyor. Çalışma, dağıtık sistemlerde çalışan akıllı yük dengeleme, çok-GPU işbirliği ve sorgu optimizasyonu teknikleriyle büyük veri analizinde çığır açıyor. Bu gelişme, kompleks ağ yapılarının analizinde hem hız hem de doğruluk açısından önemli ilerlemeler vadediyor.
arXiv (CS + AI) · 23 gün önce
0
Büyük Dil Modellerinde CPU-GPU İş Birliği ile Performans Devrimi
Yapay zeka araştırmacıları, büyük dil modellerinin uzun metin işleme kapasitesini artıran yenilikçi bir hibrit sistem geliştirdi. HybridGen adlı bu teknoloji, CPU ve GPU'nun birlikte çalışmasını sağlayarak bellek sorunlarını çözüyor. Modern dil modelleri milyonlarca kelime işleyebildiğinde, gerekli bellek miktarı yüzlerce gigabayta çıkabiliyor. Bu durum hem bellek kapasitesini hem de veri aktarım hızını zorluyor. Geleneksel çözümler ya GPU ya da CPU kullanırken, yeni sistem her ikisini koordineli şekilde kullanarak donanım kaynaklarını maksimum verimlilikle değerlendiriyor. Araştırmacılar üç temel sorunu çözdü: çok boyutlu dikkat bağımlılıkları, uzun metinlerde artan CPU-GPU yük dengesizliği ve katmanlı belleklerin NUMA cezası. Sistem, dikkat mantığı paralelliği, geri bildirim odaklı zamanlayıcı ve anlam farkında önbellek haritalaması teknikleriyle bu sorunları aşıyor.
arXiv (CS + AI) · 23 gün önce
0
Türbülans Simülasyonlarını Hızlandıran Yapay Zeka Destekli Yazılım Paketi
Araştırmacılar, türbülanslı akış simülasyonlarını önemli ölçüde hızlandıran yeni bir açık kaynak yazılım paketi geliştirdi. IncompressibleNavierStokes.jl adlı bu Julia paketi, GPU ve CPU'larda eşzamanlı çalışabilen matrix-free çekirdekler kullanarak sıkışmayan Navier-Stokes denklemlerini çözüyor. Yazılımın en dikkat çekici özelliği, yapay sinir ağı modellerinin doğrudan simülasyon içine gömülebilmesi. Bu sayede türbülans modellemesi için neural network kapanış modelleri eğitilebiliyor. Yazılım, tek bir GPU üzerinde 840³ çözünürlüğe kadar doğrudan sayısal simülasyonlar gerçekleştirebiliyor. Geliştirilen sistem, türbülanslı kanal akışı testlerinde referans verilerle başarıyla doğrulandı. Bu gelişme, hesamalı akışkanlar dinamiği alanında yapay zekanın entegrasyonu açısından önemli bir adım olarak değerlendiriliyor.
arXiv (CS + AI) · 23 gün önce
0
Yapay Zeka Modellerinin İletişim Sorunu Çözüldü: GPU İçi Sıkıştırma Tekniği
Büyük yapay zeka modellerinin eğitiminde yaşanan iletişim darboğazı, araştırmacılar tarafından geliştirilen yeni bir teknikle aşılabilir hale geldi. CCCL adlı bu sistem, GPU'lar arası veri alışverişini sıkıştırma teknikleriyle hızlandırarak, büyük dil modellerinin performansını önemli ölçüde artırıyor. Geleneksel yöntemlerde GPU'lar arasındaki veri iletişimi büyük bir zaman kaybına neden olurken, yeni sistem bu sorunu GPU içerisinde gerçekleştirdiği sıkıştırma işlemleriyle çözüyor. Sistem, mevcut uygulamalarda herhangi bir kod değişikliği gerektirmeden entegre edilebiliyor ve vLLM gibi popüler platformlarda %10'a varan performans artışı sağlıyor. Bu gelişme, yapay zeka modellerinin eğitim süreçlerinin daha verimli hale gelmesine katkı sağlayarak, teknolojinin ilerlemesinde önemli bir adım teşkil ediyor.
arXiv (CS + AI) · 23 gün önce
0
Live Avatar: Sesle Kontrol Edilen Gerçek Zamanlı Dijital Karakterler Geliştirildi
Araştırmacılar, ses komutlarıyla kontrol edilen dijital avatarları gerçek zamanlı olarak oluşturabilen Live Avatar teknolojisini geliştirdi. 14 milyar parametreye sahip yapay zeka modeli, saniyede 45 kare hızında çalışarak saatlerce kesintisiz avatar etkileşimi sağlayabiliyor. Teknoloji, mevcut difüzyon modellerinin sıralı işlem yapma zorunluluğunu aşarak, her GPU'ya farklı zaman adımları atayan yenilikçi bir paralel işleme yaklaşımı kullanıyor. Bu gelişme, video konferans, oyun, eğitim ve sosyal medya platformları için devrim niteliğinde uygulamalar sunuyor. Sistem, 10.000 saniyeyi aşan sürelerde bile görsel kalite kaybı yaşamadan çalışabiliyor ve kimlik kayması sorununu çözmüş durumda.
arXiv (CS + AI) · 23 gün önce
0
Seyrek tensör hesaplamalarında çığır açan paralel işlem algoritması geliştirildi
Araştırmacılar, seyrek tensör cebirinde paralel işlem yükünü dengeli dağıtan ilk algoritmayı geliştirdiler. Seyrek tensörler, çoğunlukla sıfır değerli elemanlardan oluşan çok boyutlu veri yapıları olup, makine öğrenmesi ve bilimsel hesaplamalarda kritik öneme sahip. Ancak bu yapıların düzensiz ve veri-bağımlı doğası, paralel işlem birimlerine eşit iş yükü dağıtımını zorlaştırıyor. Yeni algoritma, mevcut paralel birleştirme yöntemlerini genelleştirerek çok operandlı ve çok boyutlu hiyerarşik seyrek veri yapılarıyla çalışabiliyor. Araştırmacılar algoritmayı mevcut bir derleme çerçevesine entegre ederek, çok çekirdekli CPU'lar ve GPU'lar için otomatik paralel kod üretimi sağladılar. Test sonuçları, üretilen kodun Intel MKL ve NVIDIA cuSPARSE gibi endüstri standardı kütüphanelerle rekabet edebilir performans gösterdiğini ortaya koyuyor. Bu gelişme, büyük veri işleme ve yapay zeka uygulamalarında önemli performans artışları sağlayabilir.
arXiv (CS + AI) · 23 gün önce
0
EcoShift: Süper bilgisayarlarda güç tüketimini optimize eden akıllı sistem
Araştırmacılar, yüksek performanslı bilgisayar kümelerinde enerji tüketimini optimize eden yeni bir sistem geliştirdi. EcoShift adlı bu framework, CPU ve GPU'ların birlikte çalıştığı sistemlerde güç sınırlamaları altında maksimum performans elde etmeyi hedefliyor. Mevcut sistemler adil paylaşım veya kullanım oranı gibi basit yaklaşımlar kullanırken, EcoShift her uygulamanın güç kısıtlamalarına olan duyarlılığını analiz ederek daha akıllı güç dağılımı yapıyor. Intel CPU ve NVIDIA A100/H100 GPU'larla yapılan testlerde, sistem mevcut teknolojilerden %6'ya kadar daha iyi performans gösterdi. Bu gelişme, enerji maliyetlerinin arttığı dönemde süper bilgisayarların daha verimli çalışmasını sağlayabilir.
arXiv (CS + AI) · 23 gün önce
0
Süper bilgisayarlarda enerji tasarrufu sağlayan akıllı zamanlama sistemi geliştirildi
Araştırmacılar, çok GPU'lu süper bilgisayar sistemlerinde enerji verimliliğini artıran yeni bir zamanlama algoritması geliştirdi. EcoSched adlı bu sistem, GPU kaynaklarının daha akıllı dağıtımını sağlayarak hem enerji tasarrufu hem de performans artışı elde ediyor. Geleneksel yöntemlerin aksine, her uygulama için optimal GPU sayısını belirleyip işleri eş zamanlı olarak planlamaktadır. H100, A100 ve V100 sistemlerinde yapılan testlerde %14,8'e varan enerji tasarrufu, %30,1 performans artışı ve %40,4 enerji-gecikme ürünü iyileştirmesi elde edildi. Bu gelişme, süper bilgisayarların artan enerji maliyetleri karşısında önemli bir çözüm sunuyor.
arXiv (CS + AI) · 23 gün önce
0
Kuantum Bilgisayarlar için Yeni Hata Düzeltme Sistemi: GreenPeas
Araştırmacılar, kuantum bilgisayarların en büyük sorunlarından biri olan hata düzeltme işlemini devrimsel bir şekilde hızlandıran GreenPeas adlı yeni bir sistem geliştirdi. Kuantum bilgisayarlar, çevresel etkilerden dolayı sürekli hata yapma eğiliminde olduğundan, bu hataları gerçek zamanlı olarak tespit edip düzeltmek kritik önem taşıyor. Geleneksel yöntemler, tüm olası hata senaryolarını önceden hesaplayarak büyük miktarda bellek kullanıyordu. GreenPeas ise bu hesaplamaları ihtiyaç anında yaparak hem bellek kullanımını azaltıyor hem de işlem hızını artırıyor. Sistem, özellikle adaptif kuantum devreler için tasarlandı - bunlar çalışma sırasında ölçüm sonuçlarına göre yapılarını değiştirebilen gelişmiş kuantum devrelerdir. C++ ve CUDA teknolojileri kullanılarak geliştirilen sistem, GPU'ların paralel işlem gücünden yararlanarak binlerce işlemi eş zamanlı gerçekleştiriyor. Bu gelişme, pratik kuantum bilgisayarların gerçekleştirilmesinde önemli bir adım olarak görülüyor.
arXiv (CS + AI) · 23 gün önce
1
Fleet: Çok Çekirdekli GPU'lar İçin Yeni Görev Yönetim Sistemi Geliştirildi
Modern GPU'lar çoklu çip tasarımı benimserken, mevcut programlama modelleri bu yapıyı tam olarak kullanamıyor. Araştırmacılar, GPU'ların çip düzeyindeki organizasyonunu daha iyi değerlendiren Fleet adlı yeni bir sistem geliştirdi. Bu sistem, yapay zeka modellerinin çalıştırılması gibi bellek yoğun işlemlerde performansı artırmayı hedefliyor. Fleet, görevleri GPU'nun farklı seviyelerine akıllıca dağıtarak, önbellek kullanımını optimize ediyor ve gereksiz veri trafiğini azaltıyor. Özellikle büyük dil modellerinin çalıştırılmasında önemli iyileştirmeler sağlayabilecek bu yaklaşım, GPU programlamanın geleceğini şekillendirebilir.
arXiv (CS + AI) · 24 gün önce
0
Yapay Zeka Kümeleme Algoritmalarında Belirsizlik Hesaplamasında Çığır Açan Yöntem
Araştırmacılar, veri kümeleme işlemlerinde belirsizlik hesaplaması için yeni bir matematiksel çerçeve geliştirdi. Bu yöntem, geleneksel model tabanlı yaklaşımların aksine, kümeleri veri yoğunluğunun doğrudan fonksiyonları olarak ele alıyor ve belirli parametrik formlar varsaymıyor. Martingale posterior dağılımları ve yoğunluk tabanlı kümeleme tekniklerini birleştiren sistem, normalizing flows gibi gelişmiş yoğunluk tahminleyicilerini kullanabiliyor. Bu da büyük ölçekli veri setlerinde verimli çalışmasını ve modern GPU donanımında paralel işlem yapabilmesini sağlıyor. Yöntem, kümeleme yapısının belirsizlik düzeyini daha doğru hesaplayarak, yapay zeka uygulamalarında daha güvenilir sonuçlar elde etmeyi mümkün kılıyor.
arXiv (CS + AI) · 24 gün önce
0