Yapay zeka destekli sahte video teknolojisi olan deepfake'ler, gerçek ile sahte arasındaki sınırları bulanıklaştırarak hem fırsatlar hem de tehditler yaratıyor. Eğlence ve eğitim alanlarında yeni uygulamalar sunarken, kimlik hırsızlığından yanlış bilgi yayılımına kadar ciddi etik sorunlara da neden oluyor. Araştırmacılar, bu tehditlere karşı frekans tabanlı analiz yöntemlerini geliştiriyorlar. Ancak mevcut sistemlerin tek bir frekans alanına odaklanması, farklı sahte video türlerine karşı dayanıklılığını azaltıyor. Yeni çalışma, bu sorunu çözmek için üç farklı daldan frekans özelliklerini analiz eden yenilikçi bir ağ yapısı öneriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

FoleyDirector: Videolardan Ses Üretiminde Zamansal Kontrole Çığır Açan Sistem

Araştırmacılar, videolardan ses üretimi konusunda devrim niteliğinde bir sistem geliştirdi. FoleyDirector adlı bu yeni framework, video görüntülerinden ses oluştururken zamansal kontrolü mümkün kılıyor. Sistem, özellikle çoklu ses olaylarının bulunduğu karmaşık sahnelerde veya görsel ipuçlarının yetersiz olduğu durumlarda başarılı sonuçlar veriyor. Yapılandırılmış Zamansal Betikler (STS) adı verilen yenilikçi bir yaklaşım kullanarak, kısa zaman dilimlerine karşılık gelen açıklamaları işleyebiliyor. Bu teknoloji, film endüstrisi başta olmak üzere ses tasarımı alanında önemli ilerlemeler sağlayabilir. Video içeriğinden kaliteli ses üretimi konusunda yaşanan sorunları çözen sistem, off-screen sesler veya kısmen görünen nesneler gibi zorlu durumlarla da başa çıkabiliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka artık videolardan istediğiniz sesi ayırabilir

Sony araştırmacıları, videolardaki karışık sesler arasından istenen belirli sesleri ayırabilen yeni bir yapay zeka modeli geliştirdi. MMAudioSep adlı sistem, kullanıcıların metin veya video sorguları ile hangi sesi duymak istediklerini belirlemelerine olanak tanıyor. Model, önceden eğitilmiş video-ses üretim teknolojilerinin üzerine kurularak daha verimli bir şekilde geliştirildi. Bu yaklaşım sayesinde sistem sıfırdan eğitilmek zorunda kalmadı ve mevcut ses ayrıştırma modellerinden daha başarılı sonuçlar üretti. Araştırmanın en ilginç yanı, modelin ses ayrıştırma yeteneği kazandıktan sonra bile orijinal video-ses üretim kapasitesini koruması. Bu durum, temel ses üretim modellerinin farklı ses işleme görevleri için uyarlanabileceğini gösteriyor.

arXiv (CS + AI) 0