Büyük dil modellerinin hafıza kullanımını azaltmak için geliştirilen yeni bir sıkıştırma tekniği dikkat çekiyor. Araştırmacılar, geleneksel 2:4 seyreklik desenine alternatif olarak 8:16 desenini öneriyor. Bu yöntem, modellerin performansını korurken daha esnek bir yapı sunuyor. Çalışma, yapay zeka modellerindeki aykırı değerlerin ele alınmasında da önemli ilerlemeler kaydediyor. Yeni teknik, mevcut yöntemlere kıyasla minimal depolama maliyetiyle daha iyi sonuçlar elde ediyor. Bu gelişme, büyük dil modellerinin daha verimli çalıştırılması açısından önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modellerini 16 Kat Küçültecek Yeni Sıkıştırma Tekniği

Stanford araştırmacıları, büyük dil modellerinin boyutunu dramatik şekilde azaltacak yeni bir teknik geliştirdi. DuQuant++ adlı yöntem, NVIDIA'nın yeni Blackwell işlemcilerinde desteklenen MXFP4 formatını kullanarak modelleri sıkıştırırken kalite kaybını minimize ediyor. Teknik, veri içindeki aykırı değerlerin neden olduğu sıkıştırma hatalarını akıllı döndürme algoritmaları ile çözüyor. Bu gelişme, yapay zeka modellerinin mobil cihazlarda ve daha düşük güçlü donanımlarda çalışmasını mümkün kılabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Robotlar İçin Geliştirildi: Belirsizlik Ölçen Yapay Zeka Sistemi

Araştırmacılar, robotların görsel gözlemler ve doğal dil talimatlarını eylem dizilerine dönüştüren VLA modellerinin güvenilirliğini artıran yeni bir sistem geliştirdi. ReconVLA adı verilen bu yaklaşım, robotik kontrolcülerin eylem tahminlerinde ne kadar emin olduklarını ölçebiliyor ve potansiel başarısızlıkları önceden tespit edebiliyor. Sistem, mevcut VLA politikalarının eylem token çıktılarına conformal prediction tekniğini uygulayarak kalibre edilmiş belirsizlik tahminleri üretiyor. Bu tahminler, görevin yürütülme kalitesi ve başarı oranıyla doğrudan ilişkili. Ayrıca, robot durum uzayına genişletilen bu yaklaşım, tehlikeli durumları veya aykırı değerleri başarısızlık gerçekleşmeden önce algılayabiliyor. Bu gelişme, robotların gerçek dünya ortamlarında daha güvenli ve güvenilir şekilde çalışmasını sağlayacak.

arXiv (Robotik) 0

Teknoloji & Yapay Zeka

20 Apr

Dağıtık Optimizasyon Algoritmalarında Gerçek Dünya Gürültüsü Sorunu Çözüldü

Araştırmacılar, dağıtık makine öğrenmesi sistemlerinde karşılaşılan önemli bir sorunu çözdü. Geleneksel algoritmaların çoğu, idealize edilmiş 'hafif kuyruklu' gürültü modellerine dayalı olarak tasarlanıyor. Ancak gerçek hayatta veri bilimi ve istatistiksel öğrenme uygulamalarında, aykırı değerler ve ekstrem durumlar nedeniyle bu modeller yetersiz kalıyor. Yeni çalışma, sub-Weibull rastgelelik adı verilen daha gerçekçi bir gürültü modelini dağıtık optimizasyon çerçevesine entegre etti. DCSMD-SW algoritması ile dağıtık kompozit stokastik optimizasyon problemleri için yeni bir yaklaşım geliştiren araştırmacılar, yüksek olasılıklı yakınsama teorisi de ortaya koydu. Bu çalışma, büyük veri sistemlerinde ve yapay zeka uygulamalarında daha güvenilir sonuçlar elde edilmesini sağlayabilir.

arXiv (Matematik) 0