"token pruning" araması

Arama Sonuçları

83 haber

AI'da Yeni Öğrenme Stratejisi: Anlamsal Uzayda Keşif ve İyileştirme

Yapay zeka araştırmacıları, büyük dil modellerinin mantık yürütme yeteneklerini geliştirmek için yeni bir yaklaşım geliştirdi. Geleneksel yöntemler token seviyesinde çalışırken, yeni yaklaşım anlamsal uzayda keşif ve öğrenmeye odaklanıyor. Araştırmacılar, Efektif Sıralama (ER) ve bunun türevleri olan Efektif Sıralama Hızı (ERV) ile Efektif Sıralama İvmesi (ERA) kavramlarını kullanarak, AI sistemlerinin nasıl öğrendiğini daha iyi anlamaya çalışıyor. Bu yöntem, AI'nın hem yeni bilgileri keşfetme hem de mevcut bilgileri iyileştirme kapasitesini aynı anda artırabileceğini gösteriyor. Bulgular, yapay zeka sistemlerinin daha etkili mantık yürütme yetenekleri geliştirmesi için önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Apple Çiplerinde Dev AI Modelleri: 128K Bağlam Uzunluğu Tek Mac'te Mümkün Hale Geldi

Araştırmacılar Apple Silicon çiplerinde büyük dil modellerinin çalıştırılmasında çığır açan bir teknoloji geliştirdi. Open-TQ-Metal adlı yeni sistem, 70 milyar parametreli Llama 3.1 modelini tek bir 64 GB Mac bilgisayarda 128 bin token bağlam uzunluğuyla çalıştırabiliyor. Bu, daha önce hiçbir sistem tarafından başarılamayan bir performans. Teknoloji, bellek kullanımını 3,2 kat azaltırken dikkat mekanizmasını 48 kat hızlandırıyor. Sistem, KV önbelleğini anlık olarak 4-bit tam sayı formatına dönüştürerek doğrudan sıkıştırılmış veri üzerinde hesaplama yapıyor. 330 deneyden oluşan kapsamlı testlerde, yeni yöntem orijinal FP16 çıkarımla tamamen aynı sonuçları verirken bellek tüketimini 40 GB'den 12,5 GB'ye düşürüyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Büyük Dil Modellerinde Token Adaletsizliği: Latin Olmayan Alfabeler Dezavantajda

Araştırmacılar, ChatGPT gibi büyük dil modellerinin farklı dilleri işlerken ciddi bir adaletsizlik sergilediğini ortaya koydu. Latin alfabesi dışındaki yazı sistemlerini kullanan diller, aynı anlamı ifade etmek için çok daha fazla token tüketiyor. Bu durum, bu dillerdeki kullanıcılar için daha yüksek maliyet ve yavaş yanıt süresi anlamına geliyor. Token parçalanması olarak adlandırılan bu sorun, modern açık kaynak dil modellerinde bile devam ediyor. Çalışma, kelime dağarcığı genişletme yoluyla bu soruna çözüm arayan yeni bir yorumlanabilirlik tabanlı yaklaşım sunuyor.

arXiv (Dilbilim & NLP) · 24 gün önce

Teknoloji & Yapay Zeka

RACE Attention: Milyonlarca Token'lık Metinleri İşleyebilen Yeni AI Modeli

Araştırmacılar, mevcut yapay zeka modellerinin en büyük sınırlamalarından birini aştı. Geleneksel attention mekanizmaları uzun metinlerde çok yavaş kalırken, yeni geliştirilen RACE Attention sistemi milyonlarca kelimelik metinleri doğrusal zamanda işleyebiliyor. Mevcut sistemler 4 milyon kelimeyi aştığında çökürken, bu yeni yaklaşım matematiksel optimizasyonlar sayesinde çok daha hızlı çalışıyor. Dil modelleme, metin sınıflandırma ve görüntü işleme testlerinde mevcut yöntemlere eşdeğer performans gösteriyor. Bu gelişme, uzun dökümanları analiz eden, kitap boyutundaki metinlerle çalışan veya kapsamlı araştırma yapan AI sistemleri için önemli bir adım.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Video üretiminde yapay zeka hızlanıyor: Yeni spekülatif çözümleme tekniği

Araştırmacılar, otoregressif video üretimi için spekülatif çözümleme adı verilen yeni bir hızlandırma tekniği geliştirdi. SDVG adlı bu sistem, büyük dil modellerinde kullanılan hızlandırma stratejilerini video üretimine uyarlayarak, sürekli görsel verilerle çalışmanın zorluklarını aştı. Geleneksel token doğrulama yerine görüntü kalitesi yönlendiricisi kullanan teknik, video blokları için özel bir değerlendirme sistemi geliştirdi. Bu yenilik, yapay zeka destekli video üretiminin daha hızlı ve verimli hale gelmesini sağlayarak, akış video sentezi alanında önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Sistemlerinde Yeni Dönem: Tek Model İle Bilgi Arama ve Üretim

Araştırmacılar, büyük dil modellerinin dış kaynaklardan bilgi alırken yaşadığı sınırları aşan yenilikçi bir yaklaşım geliştirdi. LAnR adlı bu sistem, geleneksel yöntemlerin aksine tek bir model içinde bilgi kodlama, arama ve metin üretme işlemlerini birleştiriyor. Klasik sistemler doğal dil sorguları oluşturup ayrı bileşenler kullanırken, LAnR tamamen kendi gizli katman uzayında çalışarak daha etkili sonuçlar elde ediyor. Sistem, özel bir token vasıtasıyla yoğun arama vektörleri üretiyor ve yeterli kanıt toplandığında adaptif olarak karar veriyor. Bu gelişme, yapay zekanın bilgi doğruluğunu artırma ve halüsinasyon sorunlarını azaltma konusunda önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Ajanları Artık Daha Az Token ile Çalışacak

Büyük dil modellerini kullanan çoklu ajan sistemleri, token verimsizliği sorunu yaşıyor. Tüm ajanların aynı anda aktif olması ve gereksiz bilgi paylaşımı, maliyetleri artırıyor. Araştırmacılar, ajanların aktivasyonunu zamanlama ile kontrol eden yeni bir sistem geliştirdi. Phase-Scheduled Multi-Agent Systems (PSMAS) adlı bu çerçeve, her ajana dairesel bir manifold üzerinde sabit açısal pozisyon atayarak, sadece gerekli olan ajanları belirli zamanlarda aktif hale getiriyor. Bu yaklaşım, geleneksel koordinasyon yöntemlerinin aksine zamansal boyutu da dikkate alıyor ve token kullanımını önemli ölçüde optimize ediyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

RankUp: Büyük Ölçekli Reklam Öneri Sistemlerinde Yeni Dönem

Araştırmacılar, büyük ölçekli reklam öneri sistemlerinde karşılaşılan önemli bir sorunu çözmek için RankUp adını verdikleri yeni bir mimari geliştirdiler. Mevcut sistemlerde model derinliği artırıldığında, temsil kapasitesinin beklenenin aksine düştüğü gözlemlenmişti. Bu durum, derin katmanlarda veri temsilinin etkisizleşmesi anlamına geliyordu. RankUp mimarisi, rastgele permütasyon bölme, çoklu gömme paradigması ve global token entegrasyonu gibi yenilikçi yaklaşımlarla bu sorunu aşmayı hedefliyor. Sistem, büyük ölçekli üretim ortamında tam olarak devreye alınmış durumda. Bu gelişme, özellikle dijital reklamcılık sektörü için önemli performans artışları vaat ediyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Görsel Sıkıştırma: Basit Yöntemler Gelişmiş Tekniklerden Daha İyi

Çok modlu büyük dil modellerinde görsel token sıkıştırma yöntemlerini değerlendiren yeni bir araştırma, şaşırtıcı bir sonuç ortaya koydu. Sekiz popüler benchmark üzerinde yapılan kapsamlı çalışmada, basit görüntü boyut küçültme işleminin birçok gelişmiş sıkıştırma tekniğinden daha iyi performans gösterdiği keşfedildi. Araştırmacılar, mevcut değerlendirme kriterlerinin görsel token sıkıştırma için uygun olmadığını ve önemli miktarda gürültü içerdiğini tespit etti. Bu bulgular, yapay zeka alanında kullanılan benchmark sistemlerinin yeniden değerlendirilmesi gerektiğini gösteriyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay zeka modellerine karşı evrensel saldırı yöntemi geliştirildi

Araştırmacılar, kapalı kaynak kodlu çok modlu büyük dil modellerine (MLLM) karşı yeni bir saldırı türü geliştirdi. 'Evrensel Hedefli Aktarılabilir Düşmanca Saldırılar' adı verilen bu yöntem, tek bir pertürbasyon kullanarak farklı girdileri tutarlı şekilde belirli bir hedefe yönlendirebiliyor. Geleneksel saldırıların aksine, bu yaklaşım örnek-spesifik değil ve birden fazla girdi üzerinde tekrar kullanılabilir. Araştırma, ticari yapay zeka modellerinin güvenlik açıklarını ortaya koyması açısından önemli. Çalışma, hedef gözetimindeki yüksek varyans, token-bazlı eşleştirmenin güvenilmezliği ve başlangıç değerlerine duyarlılık gibi temel zorlukları ele alıyor. MCRMO-Attack adlı önerilen yöntem, bu sorunlara çözüm getirmeyi hedefliyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

EAST: Yapay zeka yarım kalmış hareketleri tahmin edebiliyor

Araştırmacılar, henüz tamamlanmamış hareketleri önceden tahmin edebilen yeni bir yapay zeka sistemi geliştirdi. EAST adlı bu framework, video görüntülerinin sadece bir kısmını görerek gelecekte ne olacağını kestirebiliyor. Sistem, rastgele örnekleme stratejisi kullanarak tek bir model ile farklı gözlem oranlarında çalışabiliyor. Araştırmacılar ayrıca bellek kullanımını yarıya indiren ve eğitim süresini 2 kat hızlandıran bir token maskeleme yöntemi geliştirdi. Bu teknoloji, güvenlik sistemlerinden otonom araçlara kadar birçok alanda erken uyarı sistemleri için kullanılabilir. Çalışma, sınırlı görsel kanıtlarla hareket tahmini yapmanın zorluklarını aşmak için yenilikçi yaklaşımlar sunuyor.

arXiv (CS + AI) · 24 gün önce

← 1 2 3 4 5 6 7 →