Görsel düzenleme modellerini değerlendirmek için birleşik kıyaslama sistemi

20 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, görüntü ve video düzenleme modellerinin performansını ölçmek için UniEditBench adlı kapsamlı bir değerlendirme sistemi geliştirdi. Mevcut kıyaslama yöntemlerinin dağınık yapısı ve farklı paradigmalar arasında adil karşılaştırma yapılamaması sorununa çözüm getiren sistem, dokuz farklı görüntü işlemi ve sekiz video işlemini içeriyor. Sistem, ekleme, çıkarma, değiştirme, sayma ve yeniden sıralama gibi karmaşık görevleri kapsıyor. En önemli yenilik ise büyük multimodal dil modellerinin yüksek maliyetli değerlendirme süreçlerini optimize etmek için damıtma tekniği kullanması. Bu yaklaşım hem hesaplama maliyetlerini düşürüyor hem de insan tercihlerine daha uygun değerlendirmeler yapılmasını sağlıyor.

Yapay zeka destekli görsel düzenleme araçlarının hızla gelişmesi, bu teknolojilerin performansını objektif şekilde değerlendirme ihtiyacını artırdı. Araştırmacılar bu konudaki eksikliği gidermek için UniEditBench adlı yenilikçi bir kıyaslama sistemi ortaya koydu.

Mevcut değerlendirme sistemlerinin en büyük sorunu, farklı düzenleme paradigmaları arasında tutarlı karşılaştırmalar yapılamamasıydı. Her yöntemin kendine özgü ölçütleri bulunuyor ve özellikle video düzenleme alanında güvenilir değerlendirme kriterleri eksikti. UniEditBench bu dağınık yapıyı ortadan kaldırarak hem yeniden yapılandırma tabanlı hem de talimat odaklı yöntemleri aynı protokol altında değerlendiriyor.

Sistem dokuz temel görüntü işlemini kapsıyor: ekleme, çıkarma, değiştirme, renk/doku değişikliği, çizim tabanlı düzenleme, ayıklama, ayarlama, sayma ve yeniden sıralama. Video düzenlemede ise sekiz farklı işlem kategorisi bulunuyor. Özellikle sayma ve mekansal yeniden düzenleme gibi karmaşık kompozisyonel görevlere odaklanması dikkat çekiyor.

Projenin teknik yeniliği, büyük multimodal dil modellerinin değerlendirme sürecindeki yüksek maliyetini damıtma tekniğiyle çözmesi. Bu yaklaşım, değerlendirme kalitesinden ödün vermeden hesaplama kaynaklarını optimize ediyor ve insan tercihlerine daha yakın sonuçlar üretiyor.

Etiketler

#yapay zeka #görüntü işleme #video düzenleme #makine öğrenmesi #değerlendirme sistemleri

Özgün Kaynak

UniEditBench: A Unified and Cost-Effective Benchmark for Image and Video Editing via Distilled MLLMs

https://arxiv.org/abs/2604.15871

Bu içerik, özgün kaynaktan referans alınarak yeniden yorumlanmış Türkçe bir özettir. Telif hakkı özgün yayın organına aittir.