Yapay Zeka Modellerini Hızlandıran Yeni Sıkıştırma Tekniği Geliştirildi

4 Mayıs 2026, 07:00 2 dk okuma 0 görüntülenme arXiv — Hesaplamalı Dilbilim (cs.CL)

Paylaş: Kopyalandı!

Araştırmacılar, büyük dil modellerinin boyutunu küçültmek için ARHQ adlı yenilikçi bir yöntem geliştirdi. Bu teknik, modellerin performansını korurken boyutlarını önemli ölçüde azaltabiliyor. Geleneksel sıkıştırma yöntemlerinin aksine, ARHQ hata yayılımını önlemek için ağırlıkları iki ayrı dala bölerek işlem yapıyor. Yöntem, hassas hesaplamalar gerektiren kısımları yüksek kalitede tutarken, diğer bölümleri güvenle sıkıştırıyor. Qwen3-4B modeli üzerindeki testler, bu yaklaşımın mantıksal düşünme yeteneklerini koruduğunu gösteriyor. Bu gelişme, yapay zeka modellerinin mobil cihazlarda ve sınırlı kaynaklara sahip sistemlerde daha verimli çalışmasının önünü açıyor.

Yapay zeka araştırmacıları, büyük dil modellerinin boyutunu küçültmek için Aktivasyon Artık Hessian Kuantizasyonu (ARHQ) adlı yeni bir teknik geliştirdi. Bu yöntem, modellerin performansını koruyarak boyutlarını önemli ölçüde azaltmayı hedefliyor.

ARHQ'nun temel prensibi, geleneksel sıkıştırma yöntemlerinin neden olduğu hata yayılımını engellemektir. Teknik, model ağırlıklarını iki farklı dala ayırarak çalışıyor: biri yüksek hassasiyetli düşük boyutlu dal, diğeri ise sıkıştırılmış ana dal. Bu ayrım, matematiksel analizler kullanılarak hataya duyarlı ağırlık yönlerinin belirlenmesiyle gerçekleştiriliyor.

Yöntemin en önemli özelliği, aktivasyon kuantizasyon artıklarından elde edilen bilgileri kullanarak hangi ağırlıkların kritik olduğunu analitik olarak tespit etmesi. Bu sayede, modelin düşünme yeteneği için gerekli olan kısımlar korunurken, diğer bölümler güvenle sıkıştırılabiliyor.

Qwen3-4B-Thinking-2507 modeli üzerinde yapılan deneyler, ARHQ'nun katman bazında sinyal-gürültü oranını iyileştirdiğini ve ZebraLogic mantık testlerinde başarılı sonuçlar verdiğini gösteriyor. Bu gelişme, yapay zeka modellerinin mobil cihazlarda ve sınırlı kaynaklara sahip sistemlerde daha verimli çalışmasına olanak sağlayabilir.

Etiketler

#yapay zeka #model sıkıştırma #kuantizasyon #makine öğrenmesi #optimizasyon

Özgün Kaynak

Technical Report: Activation Residual Hessian Quantization (ARHQ) for Low-Bit LLM Quantization

https://arxiv.org/abs/2605.00140

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.