Modern GPU teknolojisi, çoklu çip (chiplet) mimarisiyle yeni bir döneme girmiş durumda. Ancak günümüzde kullanılan CUDA ve HIP gibi programlama modelleri, bu gelişmiş donanım yapısının sunduğu imkânları tam olarak değerlendiremiyor. Bu durum özellikle yapay zeka uygulamalarında performans kayıplarına yol açıyor.
Araştırmacıların geliştirdiği Fleet sistemi, bu soruna kapsamlı bir çözüm getiriyor. Fleet, GPU'nun hiyerarşik yapısını daha iyi anlayan çok seviyeli bir görev yönetim modeli sunuyor. Sistemin en önemli yeniliği, 'Chiplet-task' adı verilen yeni bir soyutlama katmanı. Bu katman, işleri ve verileri belirli çiplere bağlayarak, paylaşılan L2 önbellek üzerinden koordinasyon sağlıyor.
Fleet'in getirdiği yaklaşım, mevcut dalga cephesi, işlem birimi ve cihaz düzeyindeki görevlerle uyumlu çalışırken, daha önce ele alınmamış çip düzeyinde bir organizasyon katmanı ekliyor. Sistem, çip başına özelleştirilmiş görev çizelgeleme ile çalışan sürekli çekirdek çalışma zamanı olarak uygulanıyor.
AMD Instinct MI350 üzerinde Qwen3-8B modeli ile yapılan testlerde, Fleet'in önemli performans iyileştirmeleri sağladığı görülüyor. Bu gelişme, büyük dil modellerinin çalıştırılması başta olmak üzere, bellek yoğun işlemler için GPU programlamanın geleceğini şekillendirebilir.