Video ve görüntü üreten yapay zeka teknolojilerinde yaşanan hesaplama maliyeti sorunu, yeni bir çözümle aşılmaya çalışılıyor. Araştırmacılar, Diffusion Transformer (DiT) modellerinin aşırı yüksek hesaplama gereksinimleriyle mücadele etmek için RainFusion2.0 adlı yenilikçi sistemi geliştirdi.
DiT modelleri, video ve görüntü üretiminde kullanılan güçlü yapay zeka sistemleri olmasına rağmen, dikkat mekanizmalarının gerektirdiği yoğun hesaplamalar nedeniyle pratikte kullanımları sınırlı kalıyor. Bu durum, teknolojinin yaygınlaşması önünde önemli bir engel oluşturuyor.
Mevcut seyrek dikkat yöntemleri iki temel sorunla karşı karşıya: seyrek desen tahmininin getirdiği ek yük ve yalnızca GPU'lar için optimize edilmiş olmaları. Oysa günümüzde ASIC gibi farklı donanım türleri model çıkarımında giderek daha fazla kullanılıyor.
RainFusion2.0, bu zorlukları aşmak için tasarlandı. Sistem, önemsiz token'lara yönelik hesaplamaları atlayarak dikkat mekanizmalarındaki doğal seyreklikten yararlanıyor. Çevrimiçi uyarlanabilir yapısı sayesinde düşük ek yük gerektirirken, farklı donanım türlerinde verimli çalışabiliyor.
Bu gelişme, video üretimi yapay zekasının mobil cihazlardan özel çiplere kadar geniş bir donanım yelpazesinde kullanılabilmesinin yolunu açabilir.