“GPU” için sonuçlar

Teknoloji & Yapay Zeka

21 Apr

Büyük Dil Modellerinde CPU-GPU İş Birliği ile Performans Devrimi

Yapay zeka araştırmacıları, büyük dil modellerinin uzun metin işleme kapasitesini artıran yenilikçi bir hibrit sistem geliştirdi. HybridGen adlı bu teknoloji, CPU ve GPU'nun birlikte çalışmasını sağlayarak bellek sorunlarını çözüyor. Modern dil modelleri milyonlarca kelime işleyebildiğinde, gerekli bellek miktarı yüzlerce gigabayta çıkabiliyor. Bu durum hem bellek kapasitesini hem de veri aktarım hızını zorluyor. Geleneksel çözümler ya GPU ya da CPU kullanırken, yeni sistem her ikisini koordineli şekilde kullanarak donanım kaynaklarını maksimum verimlilikle değerlendiriyor. Araştırmacılar üç temel sorunu çözdü: çok boyutlu dikkat bağımlılıkları, uzun metinlerde artan CPU-GPU yük dengesizliği ve katmanlı belleklerin NUMA cezası. Sistem, dikkat mantığı paralelliği, geri bildirim odaklı zamanlayıcı ve anlam farkında önbellek haritalaması teknikleriyle bu sorunları aşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Türbülans Simülasyonlarını Hızlandıran Yapay Zeka Destekli Yazılım Paketi

Araştırmacılar, türbülanslı akış simülasyonlarını önemli ölçüde hızlandıran yeni bir açık kaynak yazılım paketi geliştirdi. IncompressibleNavierStokes.jl adlı bu Julia paketi, GPU ve CPU'larda eşzamanlı çalışabilen matrix-free çekirdekler kullanarak sıkışmayan Navier-Stokes denklemlerini çözüyor. Yazılımın en dikkat çekici özelliği, yapay sinir ağı modellerinin doğrudan simülasyon içine gömülebilmesi. Bu sayede türbülans modellemesi için neural network kapanış modelleri eğitilebiliyor. Yazılım, tek bir GPU üzerinde 840³ çözünürlüğe kadar doğrudan sayısal simülasyonlar gerçekleştirebiliyor. Geliştirilen sistem, türbülanslı kanal akışı testlerinde referans verilerle başarıyla doğrulandı. Bu gelişme, hesamalı akışkanlar dinamiği alanında yapay zekanın entegrasyonu açısından önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modellerinin İletişim Sorunu Çözüldü: GPU İçi Sıkıştırma Tekniği

Büyük yapay zeka modellerinin eğitiminde yaşanan iletişim darboğazı, araştırmacılar tarafından geliştirilen yeni bir teknikle aşılabilir hale geldi. CCCL adlı bu sistem, GPU'lar arası veri alışverişini sıkıştırma teknikleriyle hızlandırarak, büyük dil modellerinin performansını önemli ölçüde artırıyor. Geleneksel yöntemlerde GPU'lar arasındaki veri iletişimi büyük bir zaman kaybına neden olurken, yeni sistem bu sorunu GPU içerisinde gerçekleştirdiği sıkıştırma işlemleriyle çözüyor. Sistem, mevcut uygulamalarda herhangi bir kod değişikliği gerektirmeden entegre edilebiliyor ve vLLM gibi popüler platformlarda %10'a varan performans artışı sağlıyor. Bu gelişme, yapay zeka modellerinin eğitim süreçlerinin daha verimli hale gelmesine katkı sağlayarak, teknolojinin ilerlemesinde önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Live Avatar: Sesle Kontrol Edilen Gerçek Zamanlı Dijital Karakterler Geliştirildi

Araştırmacılar, ses komutlarıyla kontrol edilen dijital avatarları gerçek zamanlı olarak oluşturabilen Live Avatar teknolojisini geliştirdi. 14 milyar parametreye sahip yapay zeka modeli, saniyede 45 kare hızında çalışarak saatlerce kesintisiz avatar etkileşimi sağlayabiliyor. Teknoloji, mevcut difüzyon modellerinin sıralı işlem yapma zorunluluğunu aşarak, her GPU'ya farklı zaman adımları atayan yenilikçi bir paralel işleme yaklaşımı kullanıyor. Bu gelişme, video konferans, oyun, eğitim ve sosyal medya platformları için devrim niteliğinde uygulamalar sunuyor. Sistem, 10.000 saniyeyi aşan sürelerde bile görsel kalite kaybı yaşamadan çalışabiliyor ve kimlik kayması sorununu çözmüş durumda.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Seyrek tensör hesaplamalarında çığır açan paralel işlem algoritması geliştirildi

Araştırmacılar, seyrek tensör cebirinde paralel işlem yükünü dengeli dağıtan ilk algoritmayı geliştirdiler. Seyrek tensörler, çoğunlukla sıfır değerli elemanlardan oluşan çok boyutlu veri yapıları olup, makine öğrenmesi ve bilimsel hesaplamalarda kritik öneme sahip. Ancak bu yapıların düzensiz ve veri-bağımlı doğası, paralel işlem birimlerine eşit iş yükü dağıtımını zorlaştırıyor. Yeni algoritma, mevcut paralel birleştirme yöntemlerini genelleştirerek çok operandlı ve çok boyutlu hiyerarşik seyrek veri yapılarıyla çalışabiliyor. Araştırmacılar algoritmayı mevcut bir derleme çerçevesine entegre ederek, çok çekirdekli CPU'lar ve GPU'lar için otomatik paralel kod üretimi sağladılar. Test sonuçları, üretilen kodun Intel MKL ve NVIDIA cuSPARSE gibi endüstri standardı kütüphanelerle rekabet edebilir performans gösterdiğini ortaya koyuyor. Bu gelişme, büyük veri işleme ve yapay zeka uygulamalarında önemli performans artışları sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

EcoShift: Süper bilgisayarlarda güç tüketimini optimize eden akıllı sistem

Araştırmacılar, yüksek performanslı bilgisayar kümelerinde enerji tüketimini optimize eden yeni bir sistem geliştirdi. EcoShift adlı bu framework, CPU ve GPU'ların birlikte çalıştığı sistemlerde güç sınırlamaları altında maksimum performans elde etmeyi hedefliyor. Mevcut sistemler adil paylaşım veya kullanım oranı gibi basit yaklaşımlar kullanırken, EcoShift her uygulamanın güç kısıtlamalarına olan duyarlılığını analiz ederek daha akıllı güç dağılımı yapıyor. Intel CPU ve NVIDIA A100/H100 GPU'larla yapılan testlerde, sistem mevcut teknolojilerden %6'ya kadar daha iyi performans gösterdi. Bu gelişme, enerji maliyetlerinin arttığı dönemde süper bilgisayarların daha verimli çalışmasını sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Süper bilgisayarlarda enerji tasarrufu sağlayan akıllı zamanlama sistemi geliştirildi

Araştırmacılar, çok GPU'lu süper bilgisayar sistemlerinde enerji verimliliğini artıran yeni bir zamanlama algoritması geliştirdi. EcoSched adlı bu sistem, GPU kaynaklarının daha akıllı dağıtımını sağlayarak hem enerji tasarrufu hem de performans artışı elde ediyor. Geleneksel yöntemlerin aksine, her uygulama için optimal GPU sayısını belirleyip işleri eş zamanlı olarak planlamaktadır. H100, A100 ve V100 sistemlerinde yapılan testlerde %14,8'e varan enerji tasarrufu, %30,1 performans artışı ve %40,4 enerji-gecikme ürünü iyileştirmesi elde edildi. Bu gelişme, süper bilgisayarların artan enerji maliyetleri karşısında önemli bir çözüm sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Kuantum Bilgisayarlar için Yeni Hata Düzeltme Sistemi: GreenPeas

Araştırmacılar, kuantum bilgisayarların en büyük sorunlarından biri olan hata düzeltme işlemini devrimsel bir şekilde hızlandıran GreenPeas adlı yeni bir sistem geliştirdi. Kuantum bilgisayarlar, çevresel etkilerden dolayı sürekli hata yapma eğiliminde olduğundan, bu hataları gerçek zamanlı olarak tespit edip düzeltmek kritik önem taşıyor. Geleneksel yöntemler, tüm olası hata senaryolarını önceden hesaplayarak büyük miktarda bellek kullanıyordu. GreenPeas ise bu hesaplamaları ihtiyaç anında yaparak hem bellek kullanımını azaltıyor hem de işlem hızını artırıyor. Sistem, özellikle adaptif kuantum devreler için tasarlandı - bunlar çalışma sırasında ölçüm sonuçlarına göre yapılarını değiştirebilen gelişmiş kuantum devrelerdir. C++ ve CUDA teknolojileri kullanılarak geliştirilen sistem, GPU'ların paralel işlem gücünden yararlanarak binlerce işlemi eş zamanlı gerçekleştiriyor. Bu gelişme, pratik kuantum bilgisayarların gerçekleştirilmesinde önemli bir adım olarak görülüyor.

arXiv (CS + AI) 2

Teknoloji & Yapay Zeka

20 Apr

Fleet: Çok Çekirdekli GPU'lar İçin Yeni Görev Yönetim Sistemi Geliştirildi

Modern GPU'lar çoklu çip tasarımı benimserken, mevcut programlama modelleri bu yapıyı tam olarak kullanamıyor. Araştırmacılar, GPU'ların çip düzeyindeki organizasyonunu daha iyi değerlendiren Fleet adlı yeni bir sistem geliştirdi. Bu sistem, yapay zeka modellerinin çalıştırılması gibi bellek yoğun işlemlerde performansı artırmayı hedefliyor. Fleet, görevleri GPU'nun farklı seviyelerine akıllıca dağıtarak, önbellek kullanımını optimize ediyor ve gereksiz veri trafiğini azaltıyor. Özellikle büyük dil modellerinin çalıştırılmasında önemli iyileştirmeler sağlayabilecek bu yaklaşım, GPU programlamanın geleceğini şekillendirebilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Kümeleme Algoritmalarında Belirsizlik Hesaplamasında Çığır Açan Yöntem

Araştırmacılar, veri kümeleme işlemlerinde belirsizlik hesaplaması için yeni bir matematiksel çerçeve geliştirdi. Bu yöntem, geleneksel model tabanlı yaklaşımların aksine, kümeleri veri yoğunluğunun doğrudan fonksiyonları olarak ele alıyor ve belirli parametrik formlar varsaymıyor. Martingale posterior dağılımları ve yoğunluk tabanlı kümeleme tekniklerini birleştiren sistem, normalizing flows gibi gelişmiş yoğunluk tahminleyicilerini kullanabiliyor. Bu da büyük ölçekli veri setlerinde verimli çalışmasını ve modern GPU donanımında paralel işlem yapabilmesini sağlıyor. Yöntem, kümeleme yapısının belirsizlik düzeyini daha doğru hesaplayarak, yapay zeka uygulamalarında daha güvenilir sonuçlar elde etmeyi mümkün kılıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Büyük Dil Modellerini TPU'larda Hızlandıran Yeni Sistem: Ragged Paged Attention

Araştırmacılar, büyük dil modellerinin Google'ın Tensor İşlem Birimleri (TPU) üzerinde daha verimli çalışmasını sağlayan yenilikçi bir sistem geliştirdiler. Ragged Paged Attention (RPA) adı verilen bu sistem, ChatGPT benzeri yapay zeka uygulamalarının maliyetini düşürürken performansını artırıyor. Çoğu mevcut sistem GPU odaklı tasarlandığı için, TPU'ların benzersiz mimarisinden tam olarak yararlanamıyordu. RPA, özellikle dinamik bellek yönetimi ve dikkat hesaplamaları konusunda üç temel teknik kullanarak bu sorunu çözüyor. Sistem, değişken uzunluktaki metinleri işlerken daha esnek davranabiliyor ve hesaplama kaynaklarını daha verimli kullanıyor. Bu gelişme, büyük dil modellerinin daha uygun maliyetli donanımlarda çalıştırılmasının önünü açarak, yapay zeka teknolojilerinin yaygınlaşmasına katkı sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

NeuroMesh: Farklı Robot Türlerinin Birlikte Çalışması İçin Yeni Yapay Zeka Sistemi

Araştırmacılar, farklı donanım özelliklerine sahip robotların daha etkili bir şekilde işbirliği yapabilmesi için NeuroMesh adlı yeni bir yapay zeka çerçevesi geliştirdi. Bu sistem, hava ve kara robotlarının aynı görevde koordineli çalışmasını sağlayan birleşik bir altyapı sunuyor. NeuroMesh, robotlar arası iletişimi standartlaştırarak ve paralel işlem mimarisi kullanarak, farklı robot türlerinin gerçek zamanlı olarak bilgi paylaşmasını ve ortak kararlar almasını mümkün kılıyor. Sistem, GPU ve CPU'yu hibrit olarak kullanarak yüksek performans elde ediyor ve çeşitli görev türlerinde başarılı sonuçlar veriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

NVIDIA'nın GPU Güvenlik Sisteminin İç Yapısı İlk Kez Deşifre Edildi

Yapay zeka iş yüklerini güvenli bir şekilde işlemek için tasarlanan NVIDIA GPU Confidential Computing (GPU-CC) sistemi, araştırmacılar tarafından kapsamlı bir güvenlik analizine tabi tutuldu. Sistemin kapalı kutu yapısının zorluklarına rağmen, araştırma ekibi GPU-CC'nin mimarisini, önyükleme sürecini ve güvenlik mekanizmalarını başarıyla çözümledi. Bu çalışma, yapay zeka uygulamalarında veri güvenliğinin nasıl sağlandığına dair önemli bilgiler sunuyor. Özellikle CPU ve GPU arasındaki veri transferlerinin güvenliği konusunda yapılan deneysel çalışmalar, sistemin güven modelinin etkinliğini değerlendiriyor. Sonuçlar, yapay zeka güvenliği alanında çalışan araştırmacılar ve geliştiriciler için kritik öneme sahip.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

EasyRider: Yapay Zeka Eğitiminin Elektrik Şebekesine Verdiği Zararı Önlüyor

Binlerce GPU ile büyük ölçekli yapay zeka modeli eğitimleri, elektrik şebekelerini tehdit eden güç dalgalanmalarına neden oluyor. Araştırmacılar, bu sorunu çözmek için EasyRider adlı yeni bir güç mimarisi geliştirdi. GPU'ların eğitim sırasında milisaniyeler içinde maksimum güçten boşta bekleme moduna geçmesi, transformatörlere ve koruma ekipmanlarına zarar verebilecek ani voltaj ve frekans değişikliklerine yol açıyor. EasyRider sistemi, raf seviyesinde pasif bileşenler ve aktif kontrollü yardımcı enerji depolama kullanarak bu güç dalgalanmalarını yumuşatıyor. Sistem, sık şarj/deşarj döngülerinde enerji depolama sisteminin ömrünü maksimize etmek için sürekli izleme yapıyor. Bu teknoloji, yapay zeka altyapısının elektrik şebekesi güvenliği açısından sürdürülebilirliğini artırıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Otonom AI Sistemlerinde CPU'nun Gizli Rolü Keşfedildi

Araştırmacılar, otonom yapay zeka sistemlerinin performans darboğazlarını CPU merkezli bir bakış açısıyla inceledi. Geleneksel AI sistemlerinin aksine, plan yapabilen, araç kullanabilen ve anlık adaptasyon gösterebilen agentic AI sistemleri, heterojen CPU-GPU mimarilerde çalışıyor. Yeni çalışma, bu sistemlerdeki CPU'nun kritik rolünü ortaya koydu. Araştırma, farklı donanım sistemlerinde uçtan uca gecikme ve verim analizleri yaparak, performans engellerini belirlemeyi amaçlıyor. Bu bulgular, gelecekteki otonom AI sistemlerinin tasarımında CPU optimizasyonunun önemini vurguluyor ve mevcut GPU-odaklı yaklaşımları sorgulayan önemli bir perspektif sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

PINNACLE: Fizik Tabanlı Yapay Zeka Modelleri İçin Yeni Açık Kaynak Çerçeve

Araştırmacılar, fizik yasalarını yapay zeka modellerine entegre eden PINN (Physics-Informed Neural Networks) teknolojisi için PINNACLE adlı kapsamlı bir açık kaynak platform geliştirdi. Bu yenilikçi çerçeve, klasik ve kuantum hesaplama yöntemlerini birleştirerek bilimsel problemlerin çözümünde önemli ilerlemeler sunuyor. Platform, çoklu GPU desteği, gelişmiş eğitim stratejileri ve modüler yapısıyla araştırmacılara elektromanyetik dalga yayılımından akışkanlar mekaniğine kadar geniş bir yelpazede fizik problemlerini çözme imkanı tanıyor. PINNACLE'ın sunduğu performans karşılaştırmaları ve ölçeklenebilirlik analizleri, bilimsel hesaplamalarda yapay zekanın kullanımını demokratikleştirmeyi hedefliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

PoSME: Sıralı Bellek İşlemleri için Yeni Kriptografik Güvenlik Sistemi

Araştırmacılar, bilgisayar belleği üzerinde sıralı işlemleri zorunlu kılan PoSME adlı yeni bir kriptografik sistem geliştirdi. Bu sistem, bellek hücrelerini zincirleyerek işlemlerin doğru sırada yapılmasını garanti ediyor ve güvenlik açıklarını önlüyor. PoSME, her adımda veri bağımlı adresleri okuyarak ve her bloğun değeri ile hash kodunu karşılıklı bağımlı hale getirerek çalışıyor. Sistem, donanım tabanlı saldırılara karşı güçlü direnç gösteriyor ve GPU'ların CPU'lara göre 14-19 kat daha yavaş performans sergilediğini ortaya koyuyor. Bu gelişme, blockchain ve kripto para sistemlerinin güvenliği açısından önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Modellerindeki Zararlı Davranışları Kökten Silmek Artık Mümkün

Araştırmacılar, yapay zeka modellerindeki zararlı ve güvenli olmayan davranışları doğrudan kaynaklarından silmek için yeni bir yöntem geliştirdi. Mistral ve LLaVA gibi hizalanmış modeller bile eğitim sürecinden kalma istenmeyen davranışlar sergileyebiliyor. Mevcut güvenlik yöntemleri sadece tercih edilen yanıtları teşvik ediyor ancak zararlı çıktılara neden olan alt ağları doğrudan kaldırmıyor. Yeni geliştirilen 'budama' çerçevesi, gradyant-free bir atıf mekanizması kullanarak bu tehlikeli parametreleri tespit ediyor ve kaldırıyor. Sistem, GPU kaynaklarını verimli kullanırken farklı mimarilerde genelleştirilebiliyor. Deneysel sonuçlar, zararlı üretimlerde önemli azalma ve jailbreak saldırılarına karşı daha iyi direnç gösterirken model performansında minimal kayıp olduğunu ortaya koyuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Mobil cihazlarda yapay zeka modellerinin gecikme süresini doğru tahmin eden yeni sistem

Akıllı telefonlarda çalışan yapay zeka uygulamaları için kritik önem taşıyan gecikme süresi tahmini konusunda önemli bir gelişme yaşandı. Araştırmacılar, mobil cihazların işlemci frekanslarının sürekli değişmesi nedeniyle oluşan tahmin zorluklarını çözen FLAME adlı sistemi geliştirdi. Geleneksel yöntemler, işlemcilerin enerji tasarrufu için frekanslarını dinamik olarak ayarlaması sebebiyle gerçek kullanımda yetersiz kalıyordu. Özellikle küçük dil modelleri gibi yeni nesil yapay zeka uygulamalarında bu sorun daha da kritik hale geliyor. Yeni sistem, CPU ve GPU arasındaki karmaşık asenkron etkileşimi dikkate alarak çok daha doğru tahminler yapabiliyor. Bu gelişme, mobil cihazlarda çalışan yapay zeka uygulamalarının performansını optimize etmek ve enerji verimliliğini artırmak açısından büyük önem taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

16 Apr

Yapay zeka modelleri için yeni derleyici teknolojisi: Event Tensor

Araştırmacılar, büyük dil modellerinin çalışmasını hızlandıran yeni bir derleyici teknolojisi geliştirdi. Event Tensor adı verilen bu sistem, GPU işlemcilerde karşılaşılan performans sorunlarını çözerek yapay zeka uygulamalarının daha verimli çalışmasını sağlıyor. Teknoloji, özellikle ChatGPT benzeri dil modellerinin yanıt verme hızını artırıyor. Geleneksel yaklaşımlar, GPU'da farklı işlemlerin başlatılması sırasında oluşan gecikmeler ve eşzamanlama sorunları yaşıyor. Event Tensor, bu işlemleri tek bir sürekli çekirdek halinde birleştirerek bu problemleri ortadan kaldırıyor. Sistem aynı zamanda değişken boyutlardaki verileri ve veriye bağlı hesaplamaları etkin şekilde yönetiyor. Test sonuçları, yeni teknolojinin büyük dil modellerinin hizmet verme süresini önemli ölçüde azalttığını ve sistem başlatma maliyetlerini düşürdüğünü gösteriyor.

arXiv (CS + AI) 0