Yapay Zeka Modellerini 16 Kat Küçültecek Yeni Sıkıştırma Tekniği

Stanford araştırmacıları, büyük dil modellerinin boyutunu dramatik şekilde azaltacak yeni bir teknik geliştirdi. DuQuant++ adlı yöntem, NVIDIA'nın yeni Blackwell işlemcilerinde desteklenen MXFP4 formatını kullanarak modelleri sıkıştırırken kalite kaybını minimize ediyor. Teknik, veri içindeki aykırı değerlerin neden olduğu sıkıştırma hatalarını akıllı döndürme algoritmaları ile çözüyor. Bu gelişme, yapay zeka modellerinin mobil cihazlarda ve daha düşük güçlü donanımlarda çalışmasını mümkün kılabilir.

Yapay zeka modellerinin giderek büyümesi, bu sistemlerin pratik kullanımında önemli bir engel oluşturuyor. Stanford Üniversitesi araştırmacıları, bu soruna çözüm olarak DuQuant++ adlı yeni bir sıkıştırma tekniği geliştirdi.

DuQuant++, NVIDIA'nın Blackwell Tensor Core işlemcilerinde donanım desteği bulunan MXFP4 mikroölçekleme formatını kullanıyor. Bu format, veri gruplarını 32 elemanlık bloklara bölerek her blok için ortak bir ölçek faktörü kullanıyor. Ancak veri içindeki aykırı değerler bu yaklaşımda büyük sorun yaratıyor.

Araştırmacıların geliştirdiği çözüm, aykırı değerlerin yoğunlaştığı kanallara özel olarak odaklanan ince ayarlı döndürme algoritmaları kullanıyor. Mevcut randomize Hadamard ve öğrenilebilir döndürme yöntemlerinin aksine, DuQuant++ veriye özgü optimizasyonlar yapıyor.

Teknik, döndürme blok boyutunu mikroölçekleme grup boyutuyla (32 eleman) hizalayarak çalışıyor. Her MXFP4 grubu bağımsız bir ölçek faktörüne sahip olduğu için, bloklar arası varyans kontrol edilebiliyor ve sıkıştırma hatası minimize ediliyor.

Bu gelişme, büyük dil modellerinin mobil cihazlarda ve daha az güçlü donanımlarda çalışabilmesine olanak tanıyacak. Özellikle enerji tüketimi ve bellek kullanımında sağlanacak iyileştirmeler, yapay zeka teknolojilerinin yaygınlaşmasını hızlandırabilir.

Yapay Zeka Modellerini 16 Kat Küçültecek Yeni Sıkıştırma Tekniği

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

40 yıllık veri: ABD siyasetini işçi sınıfı değil, elit seçmenler yeniden şekillendiriyor

Gülme Nedir ve Yapay Zeka İnsan Dilini Gerçekten Anlıyor Mu?

Wikipedia sayfalarını güncellemek bilimsel kurumlara güveni artırıyor