Teknoloji & Yapay Zeka

SAM2 Video Segmentasyonunda Yeni Yöntemle Titreşimsiz Görüntü Ayrıştırması

Yapay zeka destekli video segmentasyon teknolojilerinde önemli bir gelişme kaydedildi. SAM2 gibi interaktif video segmentasyon modelleri güçlü performans sergilerken, zayıf kullanıcı müdahalesi durumlarında titreşimli sınırlar ve nesne kayıpları gibi sorunlar yaşıyordu. Araştırmacılar, bu sorunu çözmek için yeni bir zamansal olasılık yumuşatma yöntemi geliştirdi. Optik akış tabanlı hareket dönüşümü ve piksel bazında belirsizlik tahminlerini kullanan bu yaklaşım, mevcut modeli yeniden eğitmeden veya mimarisini değiştirmeden çalışabiliyor. Yöntem, segmentasyon entropisinden türetilen belirsizlik sinyallerini ve ileri-geri akış tutarlılığını kullanarak daha stabil video segmentasyonu sağlıyor.

Yapay zeka destekli video işleme teknolojilerinde önemli bir adım atıldı. SAM2 gibi interaktif video segmentasyon modelleri, farklı görsel alanlarda güçlü genelleme kabiliyeti göstermesine rağmen, kullanıcı müdahalesinin az olduğu durumlarda ciddi sorunlarla karşılaşıyordu.

Araştırmacıların belirlediği temel problemler arasında titreşimli sınırlar, nesne kayıpları ve çerçeveler arası tutarsız nesne boyutları yer alıyor. Bu sorunlar özellikle tek bir çerçevede seyrek nokta işaretleri gibi zayıf kullanıcı denetimi sağlandığında ortaya çıkıyor ve video anlayışı ile kontrol uygulamalarında güvenilirlik sorunlarına yol açıyor.

Geliştirilen çözüm, çıkarım zamanında zamansal olasılık yumuşatma yöntemini kullanıyor. Bu yaklaşım, mevcut SAM2 modelini yeniden eğitmeye veya mimari değişiklik yapmaya gerek kalmadan, doğrudan çerçeve bazındaki segmentasyon olasılık haritaları üzerinde çalışıyor.

Yöntemin özünde optik akış tabanlı hareket dönüşümü ve piksel düzeyinde belirsizlik tahminleri yer alıyor. Bu tahminler, segmentasyon entropisinden ve ileri-geri akış tutarlılığından türetiliyor. Bu sinyal kombinasyonu, video segmentasyonunda zamansal stabilitede önemli iyileşmeler sağlayarak daha güvenilir sonuçlar üretiyor.

Özgün Kaynak
arXiv (CS + AI)
Inference-Time Temporal Probability Smoothing for Stable Video Segmentation with SAM2 under Weak Prompts
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.