VideoThinker: Uzun videolar için yeni nesil yapay zeka modeli geliştirildi

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, uzun videolardaki içerikleri daha etkili anlayabilen VideoThinker adlı yeni bir yapay zeka modeli geliştirdi. Mevcut video anlama modellerinin aksine, VideoThinker aracı tabanlı (agentic) bir yaklaşım benimsiyor ve videolardaki önemli anları adaptif şekilde keşfedebiliyor. Model, temporal geri çağırma, uzamsal yakınlaştırma ve zamansal yakınlaştırma gibi araçları kullanarak videolardaki bilgi kaybını minimize ediyor. En önemli yenilik, modelin tamamen sentetik araç etkileşim verisiyle eğitilmiş olması. Bu sayede uzun form video anlayışında döngüsel bağımlılık sorunu çözülüyor. VideoThinker, videoları zengin altyazılara dönüştürüp güçlü bir dil modeli kullanarak çok adımlı araç kullanım dizileri oluşturuyor. Bu gelişme, video analizi yapan AI sistemlerinin performansını önemli ölçüde artırabilir.

Yapay zeka alanında uzun videolar için yeni bir çığır açacak VideoThinker modeli geliştirildi. Mevcut Video Büyük Dil Modelleri (VideoLLM) uzun form videoları anlamada önemli sınırlamalara sahipken, VideoThinker bu sorunları agentic yaklaşımla çözmeyi hedefliyor.

Geleneksel modeller, videoların düzenli aralıklarla örneklenmiş karelerini statik olarak analiz ediyor. Bu yöntem, zamansal konumlandırmayı zayıflatıyor ve uzun videolarda önemli bilgi kayıplarına neden oluyor. VideoThinker ise temporal geri çağırma, uzamsal yakınlaştırma ve zamansal yakınlaştırma gibi araçları kullanarak videolardaki kritik anları adaptif şekilde keşfediyor.

Modelin en büyük yeniliği, tamamen sentetik araç etkileşim verisiyle eğitilmiş olması. Araştırmacılar, agentic video anlama verisi oluşturmanın döngüsel bir bağımlılık yarattığı sorununu fark etmiş. Çünkü böyle bir veri üretmek için zaten güçlü video anlama kabiliyetine sahip modellere ihtiyaç duyuluyor.

VideoThinker bu sorunu çözmek için videoları zengin altyazılara dönüştürüyor ve güçlü bir agentic dil modeli kullanarak altyazı uzayında çok adımlı araç kullanım dizileri üretiyor. Bu yaklaşım, video analizi alanında performans artışı sağlayabilecek önemli bir gelişme olarak öne çıkıyor.

Etiketler

#yapay zeka #video analizi #VideoLLM #agentic AI #makine öğrenmesi

Özgün Kaynak

VideoThinker: Building Agentic VideoLLMs with LLM-Guided Tool Reasoning

https://arxiv.org/abs/2601.15724

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.

Her sabah seçki, Telegram'da

Günün en önemli bilim haberleri kanalda.

Kanala Katıl

İlgili Haberler

Aynı kategoride okumaya değer

Hepsini gör →

Teknoloji & Yapay Zeka

20 sa önce

40 yıllık veri: ABD siyasetini işçi sınıfı değil, elit seçmenler yeniden şekillendiriyor

Son 40 yılın başkanlık seçimlerini analiz eden araştırmacılar, Amerikan siyasetindeki büyük değişimin arkasında yaygın kanaatin aksine işçi sınıfının değil, varlıklı ve yüksek eğitimli beyaz seçmenlerin olduğunu ortaya koydu. Çalışma, bu grubun istikrarlı bir şekilde Demokrat Parti'ye yöneldiğini gösteriyor. Bulgular, siyasi yeniden yapılanmanın nedenlerine dair genel kabul görmüş görüşleri sorguluyor ve elit seçmenlerin siyasi tercihlerindeki değişimin rolünü ön plana çıkarıyor. Araştırma, demografik değişimlerin siyasi davranış üzerindeki etkilerini anlamak için önemli veriler sunuyor.

PsyPost Oku

Teknoloji & Yapay Zeka

1 gün önce

Gülme Nedir ve Yapay Zeka İnsan Dilini Gerçekten Anlıyor Mu?

Dil ve dilbilim alanındaki iki yeni çalışma dikkat çekici sorulara yanıt arıyor. Almeida'nın Humanities and Social Sciences Communications'da yayınlanan makalesi gülmenin doğasını felsefi ve bilimsel açıdan inceliyor. Diğer yandan Leivada ve ekibinin Philosophical Transactions of the Royal Society A'da yayınlanan araştırması, büyük dil modellerinin gerçekten insan dilini ve kelimelerin arkasındaki dünyayı anlayıp anlamadığını sorguluyor. Her iki çalışma da insan iletişiminin karmaşıklığını farklı perspektiflerden ele alıyor.

Language Log Oku

Teknoloji & Yapay Zeka

1 gün önce

Wikipedia sayfalarını güncellemek bilimsel kurumlara güveni artırıyor

Yeni bir araştırma, bilimsel organizasyonların Wikipedia sayfalarının uzmanlar tarafından düzenli olarak güncellenmesinin halkın bu kurumlara duyduğu güveni önemli ölçüde artırdığını ortaya koydu. American Association for Anatomy'nin Wikipedia sayfası akademik bir uzman tarafından kapsamlı şekilde güncellendiğinde, okuyucular organizasyonu daha güvenilir olarak algıladı. Bu bulgu, bilim insanlarının platformu aktif olarak düzenleyerek doğru bilimsel bilgiye erişimi iyileştirmesi gerektiğini gösteriyor. Araştırma, Wikipedia'nın bilimsel kurumların halkla iletişiminde kritik rol oynadığını vurguluyor.

PsyPost Oku