Alibaba'nın araştırma departmanı tarafından geliştirilen Qwen3.5-Omni, yapay zeka dünyasında çok modalı modellerin yeni zirvesini temsil ediyor. Bu gelişmiş sistem, önceki versiyonlarından çok daha kapsamlı yeteneklere sahip olarak karşımıza çıkıyor.
Modelin en dikkat çekici özelliği, farklı veri türlerini aynı anda işleyebilme kabiliyeti. Metin-görsel çiftlerden oluşan devasa bir veri kümesi ve 100 milyondan fazla saatlik görsel-işitsel içerikle eğitilen sistem, gerçek anlamda 'çok modalı' bir yapay zeka deneyimi sunuyor.
Qwen3.5-Omni-plus versiyonu, 215 farklı ses ve görsel-işitsel test kategorisinde sektör lideri sonuçlar elde etti. Özellikle ses işleme görevlerinde Google'ın Gemini-3.1 Pro modelini geçerken, kapsamlı görsel-işitsel anlama testlerinde de benzer performans sergiledi.
Sistemin teknik mimarisi de oldukça yenilikçi. Hibrit Dikkat Uzmanlar Karışımı (MoE) çerçevesi kullanan model, hem 'Düşünen' hem de 'Konuşan' bileşenleri için optimize edilmiş. Bu sayede 256 bin token'lık bağlam uzunluğu ile 10 saate kadar ses kaydını anlayabilir ve 400 saniyeye kadar kesintisiz işlem yapabilir.
Bu gelişme, yapay zeka asistanları, çok modalı arama sistemleri ve interaktif uygulamalar için yeni olanaklar açıyor.