Yapay zeka alanında video analizi konusunda önemli bir gelişme yaşandı. Araştırmacıların geliştirdiği LiquidTAD adlı yeni model, videolardaki eylemleri tespit etme konusunda mevcut teknolojilere önemli bir alternatif sunuyor.
Günümüzde video içerisindeki eylemleri tanımlama işlemi büyük ölçüde Transformer tabanlı mimariler tarafından gerçekleştiriliyor. Bu sistemler yüksek performans sergiliyor ancak karmaşık hesaplama gereksinimleri ve fazla parametre kullanımı nedeniyle kaynak açısından oldukça maliyetli. Özellikle mobil cihazlar gibi sınırlı donanıma sahip ortamlarda kullanımları zorlaşıyor.
LiquidTAD, bu soruna sıvı sinir ağlarından (Liquid Neural Networks) ilham alarak çözüm getiriyor. Geleneksel sıvı sinir ağlarının sıralı işlem yapma kısıtını aşmak için, araştırmacılar kapalı-form sürekli-zaman formülasyonu adı verilen bir yaklaşım kullandı. Bu sayede model, sürekli-zaman dinamiklerinin fiziksel özelliklerini korurken paralel işlem yapabilme kabiliyeti kazandı.
Yeni mimarinin en önemli avantajı, karmaşık zamansal bağımlılıkları doğrusal hesaplama karmaşıklığıyla yakalaması. Bu, geleneksel Transformer modellerinin karesel karmaşıklığına kıyasla büyük bir verimlilik artışı anlamına geliyor. Ayrıca sistem, öğrenilmiş zaman sabitleri aracılığıyla zamansal hassasiyeti kendiliğinden ayarlayabiliyor.