Teknoloji & Yapay Zeka

Fleet: Çok Çekirdekli GPU'lar İçin Yeni Görev Yönetim Sistemi Geliştirildi

Modern GPU'lar çoklu çip tasarımı benimserken, mevcut programlama modelleri bu yapıyı tam olarak kullanamıyor. Araştırmacılar, GPU'ların çip düzeyindeki organizasyonunu daha iyi değerlendiren Fleet adlı yeni bir sistem geliştirdi. Bu sistem, yapay zeka modellerinin çalıştırılması gibi bellek yoğun işlemlerde performansı artırmayı hedefliyor. Fleet, görevleri GPU'nun farklı seviyelerine akıllıca dağıtarak, önbellek kullanımını optimize ediyor ve gereksiz veri trafiğini azaltıyor. Özellikle büyük dil modellerinin çalıştırılmasında önemli iyileştirmeler sağlayabilecek bu yaklaşım, GPU programlamanın geleceğini şekillendirebilir.

Modern GPU teknolojisi, çoklu çip (chiplet) mimarisiyle yeni bir döneme girmiş durumda. Ancak günümüzde kullanılan CUDA ve HIP gibi programlama modelleri, bu gelişmiş donanım yapısının sunduğu imkânları tam olarak değerlendiremiyor. Bu durum özellikle yapay zeka uygulamalarında performans kayıplarına yol açıyor.

Araştırmacıların geliştirdiği Fleet sistemi, bu soruna kapsamlı bir çözüm getiriyor. Fleet, GPU'nun hiyerarşik yapısını daha iyi anlayan çok seviyeli bir görev yönetim modeli sunuyor. Sistemin en önemli yeniliği, 'Chiplet-task' adı verilen yeni bir soyutlama katmanı. Bu katman, işleri ve verileri belirli çiplere bağlayarak, paylaşılan L2 önbellek üzerinden koordinasyon sağlıyor.

Fleet'in getirdiği yaklaşım, mevcut dalga cephesi, işlem birimi ve cihaz düzeyindeki görevlerle uyumlu çalışırken, daha önce ele alınmamış çip düzeyinde bir organizasyon katmanı ekliyor. Sistem, çip başına özelleştirilmiş görev çizelgeleme ile çalışan sürekli çekirdek çalışma zamanı olarak uygulanıyor.

AMD Instinct MI350 üzerinde Qwen3-8B modeli ile yapılan testlerde, Fleet'in önemli performans iyileştirmeleri sağladığı görülüyor. Bu gelişme, büyük dil modellerinin çalıştırılması başta olmak üzere, bellek yoğun işlemler için GPU programlamanın geleceğini şekillendirebilir.

Özgün Kaynak
arXiv (CS + AI)
Fleet: Hierarchical Task-based Abstraction for Megakernels on Multi-Die GPUs
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.