Video üretim teknolojilerinin hızla gelişmesiyle birlikte, yapay zeka modelleri artık daha uzun ve karmaşık videolar oluşturabiliyor. Ancak bu ilerlemeler, mevcut değerlendirme sistemlerinin sınırlarını da gözler önüne seriyor.

Geleneksel video değerlendirme metrikleri, esas olarak kısa video klipleri için tasarlanmış durumda. Bu sistemler, kare bazlı görsel kalite ve yerel temporal pürüzsüzlük gibi faktörleri ölçmekte başarılı olsa da, uzun videolarda kritik öneme sahip özellikleri yakalayamıyor.

Araştırmacılar, uzun videolarda anlatı zenginliği ve küresel nedensel tutarlılık gibi unsurların, kısa vadeli görsel algıdan tamamen farklı bir boyutta olduğunu belirtiyor. Bu nedenle, uzun video değerlendirmelerinin kısa video analizlerinden ayrıştırılması gerektiğini savunuyorlar.

Long-CODE çerçevesi, bu soruna özel olarak odaklanan bir çözüm sunuyor. Sistem, uzun video özelliklerini bozma testleri aracılığıyla mevcut metriklerin kritik sınırlarını ortaya çıkarıyor ve uzun içerik değerlendirmesi için özelleşmiş bir yaklaşım geliştiriyor.

Bu gelişme, video yapay zekası teknolojilerinin daha güvenilir şekilde değerlendirilmesi açısından önemli bir adım olarak kabul ediliyor.