Yapay zeka dünyasında dikkat çeken Mamba modeli, teorik olarak her kelimeyi sıkıştırılmış bir hafızada saklayabiliyor. Araştırmacılar, bu özelliğin otomatik cümle özetleme için kullanılabileceğini düşünmüştü. Ancak yeni çalışma, bu beklentiyi karşılamadığını ortaya koydu. Mamba-130M modeli üzerinde yapılan testlerde, beş farklı benchmark görevinde (duygu analizi, dilbilgisel doğruluk, cümle benzerliği gibi) modelin donmuş temsilleri incelendi. Sonuçlar hayal kırıklığı yarattı: özel sınır noktalarından çıkarılan temsiller, basit ortalama alma yönteminden tutarlı bir şekilde daha iyi performans gösteremedi. Daha da önemlisi, araştırmacılar modelin iç yapısında iki ciddi sorun tespit etti: temsillerin birbirine aşırı benzemesi ve son durum vektörlerinde anlam kaybı. Bu bulgular, Mamba gibi yeni nesil dil modellerinin teorik potansiyellerini pratiğe dönüştürmenin düşünülenden daha karmaşık olduğunu gösteriyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Hafızasını Güçlendiren Yeni Matematiksel Model: Mamba'ya Bilineer Güncelleme

Yapay zeka modellerinin hafıza ve hesaplama kapasitelerini artırmak için yeni bir yaklaşım geliştirildi. Mamba gibi Seçici Durum Uzayı Modelleri (SSM'ler), şu anda diagonal durum geçişleri kullanarak hem hafıza tutma hem de çarpımsal hesaplama yeteneklerinde sınırlı kalıyor. Araştırmacılar, bu modellere bilineer girdi modülasyonu ekleyerek performansı önemli ölçüde artırdılar. Yeni sistem, Koopman bilineer formları kullanarak durum-girdi çarpımı gerçekleştiriyor ve iki farklı uygulama sunuyor: tam bilineer hesaplama yapan Coupled-BIM ve paralel işleme uyumlu Coupled-GM. Test sonuçları, Coupled-GM'nin hafıza tutma kapasitesini, Coupled-BIM'in ise hem hafızayı hem de bilineer hesaplama yeteneğini belirgin şekilde geliştirdiğini gösterdi.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka ile Doğa Sesleri Tanıma: Yeni Mamba Modeli Transformers'a Rakip Oluyor

Araştırmacılar, wildlife seslerini tanımak için BioMamba adlı yeni bir yapay zeka modeli geliştirdi. Mamba mimarisini temel alan bu model, doğa seslerinin analizinde şu anda en gelişmiş Transformer modellerine benzer performans gösterirken, çok daha az bellek kullanıyor. Büyük ses veritabanları üzerinde kendi kendine öğrenme yöntemiyle eğitilen BioMamba, çeşitli sınıflandırma ve tespit görevlerinde test edildi. Sonuçlar, Mamba'nın gerçek zamanlı çevre izleme uygulamaları için hesaplama açısından verimli bir alternatif olabileceğini gösteriyor. Bu gelişme, özellikle saha koşullarında sınırlı kaynaklarla çalışması gereken ekolojik araştırmalar için önemli. Doğa koruma projelerinde ses tabanlı wildlife izleme giderek yaygınlaşırken, daha az enerji ve bellek gerektiren modeller kritik önem taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

COREY: Yapay Zeka Modellerini Hızlandıran Yeni Zamanlama Algoritması

Araştırmacılar, Mamba tipi yapay zeka modellerinin performansını artırmak için COREY adlı yenilikçi bir zamanlama algoritması geliştirdi. Bu sistem, aktivasyon entropisini kullanarak modelin çalışma zamanında otomatik olarak en verimli işlem parça boyutlarını belirliyor. Mamba modelleri doğrusal zamanda sekans işleme yapabilmesine rağmen, pratikte bellek bant genişliği sınırlamaları yaşıyor. COREY, sabit genişlikli histogramlar aracılığıyla tahmin edilen entropi değerlerini kullanarak bu sorunu çözmeyi hedefliyor. Sistem, mevcut Triton çekirdeği üzerinde çalışan tek parametreli bir otomatik ayarlayıcı olarak tasarlandı. Test sonuçları, entropi güdümlü gruplama yönteminin gecikme süresini ve DRAM trafiğini azalttığını gösteriyor. RTX 3070 kartında Mamba-370M modeli ile yapılan deneylerde, entropi hesaplama ve parça seçiminin model üretim sürecinin kritik yolunda başarıyla çalışabildiği kanıtlandı.

arXiv (CS + AI) 0