Yapay zeka video analiz performansında çığır açan VideoP2R sistemi geliştirildi

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, büyük video dil modellerinin akıl yürütme yeteneklerini önemli ölçüde artıran VideoP2R adlı yeni bir sistem geliştirdi. Bu sistem, video analizini algılama ve mantık yürütme olmak iki ayrı süreç olarak ele alarak, mevcut yöntemlerden farklılaşıyor. VideoP2R-CoT-162K adlı özel bir veri seti kullanarak eğitilen sistem, video anlama ve akıl yürütme konularında yedi kriterden altısında en yüksek performansı gösterdi. Sistem, önce denetimli öğrenme sonra pekiştirmeli öğrenme olmak üzere iki aşamalı bir yaklaşım benimsiyor ve her süreç için ayrı ödüller veren PA-GRPO algoritmasını kullanıyor. Bu gelişme, yapay zekanın video içeriklerini anlama ve yorumlama kapasitesinde önemli bir ilerleme anlamına geliyor.

Yapay zeka alanında video anlama teknolojisi, yeni geliştirilen VideoP2R sistemiyle önemli bir adım attı. Bu sistem, büyük video dil modellerinin akıl yürütme yeteneklerini geliştirmek için algılama ve mantık yürütme süreçlerini birbirinden ayıran yenilikçi bir yaklaşım benimsiyor.

VideoP2R'ın temelinde iki aşamalı bir eğitim süreci bulunuyor. İlk aşamada denetimli ince ayar yapılırken, ikinci aşamada pekiştirmeli öğrenme teknikleri kullanılıyor. Araştırmacılar bu süreç için VideoP2R-CoT-162K adlı özel bir veri seti oluşturdu. Bu veri seti, algılama ve akıl yürütme için yüksek kaliteli düşünce zinciri örnekleri içeriyor.

Sistemin en dikkat çekici özelliği, PA-GRPO (Process-Aware Group Relative Policy Optimization) algoritması. Bu algoritma, algılama ve mantık yürütme süreçlerine ayrı ayrı ödüller vererek modelin her iki alanda da gelişimini destekliyor. Geleneksel yöntemlerden farklı olarak, video analizini tek bir süreç olarak görmek yerine bu iki temel bileşeni ayırıyor.

Yapılan kapsamlı testlerde VideoP2R, video akıl yürütme ve anlama alanlarında kullanılan yedi kriterden altısında en yüksek performansı gösterdi. Bu sonuç, sistemin mevcut teknolojilere göre önemli bir üstünlük sağladığını gösteriyor ve video analizi alanında yeni standartlar oluşturuyor.

Yapay zeka video analiz performansında çığır açan VideoP2R sistemi geliştirildi

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

İnsan gözünü taklit eden yeni sinaps teknolojisi geliştirildi

NVIDIA kampüsünde dikey yüzeylerde çalışan yapay zeka robotu test ediliyor

Avustralya'da 4 Günlük Çalışma Haftası Deneyi Başarılı Sonuçlar Verdi