Yapay zeka alanında video analizi ve anlama konusunda önemli bir gelişme yaşandı. Araştırmacılar, mevcut yöntemlerin sınırlarını aşan 'Bul, Düzelt, Akıl Yürüt' (Find, Fix, Reason) adlı yeni bir yaklaşım geliştirdi.
Mevcut video analiz sistemleri genellikle pekiştirmeli öğrenme kullanıyor ancak bu yöntemler önemli sınırlamalara sahip. Bazı sistemler kendi kendine keşif yaparak öğreniyor ama model bilgi sınırına ulaştığında durgunlaşıyor. Diğer yaklaşımlar ise karmaşık düzenleme gerektiren karma yöntemler kullanıyor.
Yeni sistem, büyük ve küçük yapay zeka modellerini akıllıca birleştiriyor. Büyük 'öğretmen' model, video içeriğinde eksik kalan uzamsal ve zamansal bağlantıları tespit ediyor. Ardından, küçük 'öğrenci' modele sadece gerekli kanıt parçalarını - zaman damgaları, belirli bölgeler gibi - minimal veri olarak sunuyor.
Bu yaklaşımın en büyük avantajı, karmaşık ön eğitim süreçlerine ihtiyaç duymaması. Büyük modeller zaten çok modalı anlama ve talimat takip etme konusunda başarılı oldukları için, bu yetenekleri küçük modellere rehberlik etmek için kullanılabiliyor.
Araştırma, video içeriği anlama, güvenlik kameraları analizi ve eğitim teknolojileri gibi alanlarda pratik uygulamalara sahip olma potansiyeli taşıyor.