Akıllı Telefonlarda Yapay Zeka Devrimi: Samsung Galaxy'de Çok Dilli LLM

Araştırmacılar, Samsung Galaxy S24 ve S25 cihazlarında büyük dil modellerini (LLM) verimli şekilde çalıştıran yenilikçi bir sistem geliştirdi. Bu çalışma, akıllı telefonların sınırlı bellek ve işlem gücü kısıtları altında çoklu görevleri destekleyen tek bir yapay zeka modelinin nasıl çalıştırılabileceğini gösteriyor. Sistem, farklı uygulama alanları için özelleştirilmiş LoRA modüllerini kullanarak tek seferde resmi, kibar veya eğlenceli gibi farklı tarzlarda yanıtlar üretebiliyor. Dynamic Self-Speculative Decoding tekniği sayesinde gecikme süresi 6 kata kadar azaltılmış. Bu gelişme, yapay zekanın mobil cihazlarda daha geniş kullanım alanı bulmasının önünü açıyor ve kullanıcılara bulut bağlantısı olmadan gelişmiş AI deneyimi sunuyor.

Samsung Galaxy akıllı telefonlarda yapay zeka teknolojisinde önemli bir adım atıldı. Araştırmacılar, büyük dil modellerinin (LLM) mobil cihazlarda verimli şekilde çalışması için yeni bir framework geliştirdi.

Bu yenilikçi sistem, LLaMA tabanlı çok dilli bir temel modeli Samsung Galaxy S24 ve S25 cihazlarının Qualcomm işlemcilerinde başarıyla çalıştırıyor. En dikkat çekici özelliği, tek bir donmuş çıkarım grafiği üzerinde farklı görevler için özelleştirilmiş LoRA modüllerini çalışma zamanında kullanabilmesi.

Sistemin en etkileyici yeteneği, tek bir ileri geçişte resmi, kibar veya eğlenceli gibi farklı tarzlarda yanıtları eş zamanlı olarak üretebilmesi. Bu çok akışlı kod çözme mekanizması, gecikme süresini 6 kata kadar azaltıyor.

Token üretimini hızlandırmak için Dynamic Self-Speculative Decoding (DS2D) adlı ağaç tabanlı strateji kullanılıyor. Bu teknik, gelecekteki tokenları önceden tahmin ederek işlem hızını artırıyor.

Bu gelişme, yapay zekanın mobil cihazlarda bulut bağlantısı olmadan çalışabilmesinin önünü açıyor ve kullanıcılara daha hızlı, daha özel AI deneyimi sunuyor.