Fizik bilincine sahip yapay zeka videodan kütle ve hızı hesaplayarak gerçekçi sesler üretiyor

Paylaş: Kopyalandı!

Araştırmacılar, videodan ses üretebilen yeni bir yapay zeka sistemi geliştirdi. Bu sistem, geleneksel yaklaşımların aksine nesnelerin fiziksel özelliklerini de dikkate alarak daha gerçekçi sesler oluşturabiliyor. Jurassic Park'taki dev dinozorların ağır ayak seslerini doğru tahmin edebilmemiz gibi, insanlar da nesnelerin boyutu, ağırlığı ve hareket hızına bakarak ses öngörüsünde bulunur. Mevcut video-ses dönüştürme sistemleri ise sadece nesne kategorilerine odaklanıyordu. Yeni geliştirilen fizik-farkında AI ise kütleyi ve hızı hesaba katarak bu önemli eksikliği gideriyor.

Bilim insanları, videoların sesli versiyonlarını üretebilen yapay zeka teknolojisinde önemli bir atılım gerçekleştirdi. Geliştirilen yeni sistem, nesnelerin fiziksel özelliklerini analiz ederek daha gerçekçi ses efektleri oluşturabiliyor.

Mevcut video-ses dönüştürme teknolojileri genellikle görüntüdeki nesnelerin türüne bakarak ses üretiyordu. Örneğin bir arabayı gördüğünde araba sesi, bir kuşu gördüğünde kuş sesi çıkarıyordu. Ancak bu yaklaşım, aynı nesnenin farklı koşullardaki ses farklılıklarını yakalayamıyordu.

Yeni geliştirilen fizik-farkında AI sistemi ise devrim niteliğinde bir yaklaşım sergiliyor. Sistem, videodan nesnelerin kütlesini ve hızını tahmin ederek bu bilgileri ses üretim sürecine dahil ediyor. Bu sayede ağır bir kamyonla hafif bir arabanın motor seslerindeki farkı, ya da yavaş yürüyen bir fil ile koşan bir filin ayak seslerindeki değişimi doğru şekilde modelleyebiliyor.

Araştırmacılar, insanların doğal olarak nesnelerin fiziksel özelliklerinden yola çıkarak ses tahminleri yaptığına dikkat çekiyor. Film endüstrisinden oyun sektörüne kadar pek çok alanda kullanım potansiyeli bulunan bu teknoloji, sanal gerçeklik deneyimlerini de daha immersif hale getirebilir.

Fizik bilincine sahip yapay zeka videodan kütle ve hızı hesaplayarak gerçekçi sesler üretiyor

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Büyükanne ve Büyükbabaların Geliri Torunların Üniversite Fırsatlarını Etkiliyor

Robotlar İnsan Duygularını Okumayı Öğreniyor: Yeni Görsel Dil Modelleri

Edge AI Robotları Herkese Açıyor: Windows Etkisi Tekrarlanıyor