“görsel kalite” için sonuçlar

Teknoloji & Yapay Zeka

21 Apr

FlashLips: Saniyede 100 Kare Hızında Gerçek Zamanlı Dudak Senkronizasyonu

Araştırmacılar, video ve ses arasındaki dudak senkronizasyonunu gerçek zamanlı olarak gerçekleştiren yeni bir sistem geliştirdi. FlashLips adı verilen bu teknoloji, tek bir grafik kartında saniyede 100 karenin üzerinde işlem yapabilirken, mevcut en gelişmiş modellerin görsel kalitesini yakalıyor. Sistem, geleneksel GAN ve difüzyon modellerinin aksine yeniden yapılandırma temelli bir yaklaşım kullanıyor. İki aşamalı yapısıyla hem hız hem de kalite açısından önemli bir ilerleme sunuyor. Bu gelişme, video konferans uygulamaları, dijital avatarlar ve eğlence sektöründe devrim yaratabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

3D Sahne Görselleştirmede Geometrik Doğruluğun Yeni Ölçüm Yöntemi

Yapay zeka destekli görselleştirme teknolojileri olan NeRF ve Gaussian Splatting, 3D sahneleri gerçekçi bir şekilde yeniden oluşturabiliyor. Ancak bu yöntemlerin görsel kalitesi yeterli olsa da geometrik doğruluklarını değerlendirmek zorlu bir süreç. Araştırmacılar, bu teknolojilerin yüzey geometrisi açısından ne kadar başarılı olduğunu ölçen yeni bir değerlendirme sistemi geliştirdi. Bu çalışma özellikle robotik uygulamaları için kritik önem taşıyor çünkü nesneleri kavrama ve manipüle etme görevlerinde hassas geometrik bilgi gerekiyor. 19 farklı sahneyi kapsayan kapsamlı bir test seti oluşturan ekip, nöral görselleştirme yöntemlerinin yüzey ve şekil doğruluğunu sistematik olarak analiz edebilen bir araç sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri Soyut Anlamları Neden Kavrayamıyor?

Görsel-dil modelleri fotoğraf kalitesinde görüntüler üretebilse de, deyimsel ifadelerin soyut anlamlarını kavramakta zorlanıyor. Yeni bir araştırma, bu modellerin neden hep somut anlamları tercih ettiğini ortaya koyuyor. DIVA adlı test sistemi ile 8 farklı model incelendiğinde, tümünün 'Literal Üstünlük Önyargısı' sergilediği keşfedildi. Bu durum, modellerin büyümesi ya da görsel kalitelerinin artmasıyla çözülmüyor. Araştırmacılar, yüksek görsel ayrıntının aslında soyut düşünmeyi engelleyebileceğini öne sürüyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Video üretiminde yapay zekaya 4 kata kadar hızlanma: AdaCluster yöntemi geliştirildi

Yapay zeka destekli video üretim sistemleri, karmaşık hesaplama gereksinimleri nedeniyle oldukça yavaş çalışıyor. Araştırmacılar, video üreten dönüştürücü modellerin hızını artırmak için AdaCluster adlı yeni bir yaklaşım geliştirdi. Bu yöntem, modelin dikkat mekanizmasını optimize ederek hesaplama yükünü azaltıyor. Geleneksel yöntemler video kalitesinden ödün verirken, AdaCluster hem hızı artırıyor hem de görsel kaliteyi koruyor. Sistem, video verilerindeki anlamsal benzerlikleri akıllıca gruplandırarak gereksiz hesaplamaları elimine ediyor. Test sonuçları, popüler video üretim modelleri üzerinde 1,67 ila 4,31 kat hız artışı sağlandığını gösteriyor. Bu gelişme, yapay zeka tabanlı video üretim teknolojilerinin daha geniş kullanım alanları bulmasına katkı sağlayabilir. Özellikle içerik üreticileri ve medya sektörü için pratik faydalar sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Uzun Videolar İçin Yeni Değerlendirme Sistemi: Long-CODE Çerçevesi

Yapay zeka destekli video üretim modelleri giderek daha uzun videolar oluşturabilir hale gelirken, mevcut değerlendirme sistemleri yetersiz kalıyor. Araştırmacılar, geleneksel metriklerin sadece kısa video segmentlerini ve görsel kaliteyi ölçebildiğini, ancak uzun videolardaki anlatı tutarlılığı ve küresel nedensellik gibi kritik özellikleri yakalayamadığını keşfetti. Bu sorunu çözmek için Long-CODE adlı yeni bir değerlendirme çerçevesi geliştirildi. Sistem, kısa vadeli görsel algı ile uzun bağlam özelliklerini birbirinden bağımsız boyutlar olarak ele alarak, uzun video içeriklerinin daha doğru şekilde değerlendirilmesini sağlıyor. Bu gelişme, video yapay zekası alanında önemli bir adım olarak görülüyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Bulut Oyunculuk İçin Yeni Optimizasyon Sistemi: Stimpack

Araştırmacılar, bulut oyunculuk sistemleri için yenilikçi bir optimizasyon teknolojisi geliştirdi. Stimpack adı verilen sistem, ağ üzerinden sıkıştırılarak aktarılan içeriklerde yüksek kaliteli görüntü işlemenin her zaman etkili olmadığı gerçeğinden yola çıkıyor. Sistem, sunucu tarafındaki işleme maliyetleri ile kullanıcının algıladığı görsel kalite arasında akıllı bir denge kurarak kaynak kullanımını optimize ediyor. Çok kullanıcılı senaryolarda sistem verimliliğini en üst düzeye çıkarmak için kaynak kullanım etkinliğini ölçen bir mekanizma kullanıyor. Açık kaynak olarak sunulan uygulama, kapsamlı testlerde geleneksel yöntemlere kıyasla önemli performans artışları gösteriyor. Bu gelişme, edge sunuculardaki sınırlı kaynakların daha verimli kullanılması ve bulut oyunculuk deneyiminin iyileştirilmesi açısından kritik bir adım niteliğinde.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Görsel Üretiminde Çığır Açan Hibrit Model Geliştirildi

Araştırmacılar, metin açıklamalarından görsel üreten yapay zeka sistemlerinde devrim niteliğinde bir ilerleme kaydetti. Uniform Discrete Diffusion Model (UDM) adı verilen teknikle pekiştirmeli öğrenmeyi birleştiren yeni hibrit yaklaşım, görsel kalitesinde dramatik iyileşmeler sağladı. UDM-GRPO adlı bu yenilikçi framework, geleneksel diffusion modellerinin eğitim sürecindeki kararsızlık sorunlarını çözerek, hem daha stabil hem de verimli bir öğrenme süreci sunuyor. Sistem, temiz örnek verileri eylem olarak kullanma ve diffusion ileri süreciyle yörünge yeniden yapılandırma gibi akıllı stratejilerle optimize edildi. Test sonuçları oldukça etkileyici: GenEval doğruluğu %69'dan %96'ya, PickScore ise 20 puanın üzerine çıktı.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka artık tutarlı hikaye görselleştirmesi yapabiliyor

Araştırmacılar, metinlerden tutarlı görsel hikayeler oluşturabilen yenilikçi bir yapay zeka sistemi geliştirdi. ReCap adı verilen bu sistem, hikayedeki karakterlerin kimliklerini koruyarak art arda gelen görsellerde tutarlılık sağlıyor. Geleneksel yöntemler büyük bellek bankaları ve karmaşık mimariler gerektirirken, ReCap sadece 149 bin ek parametre kullanarak aynı başarıyı elde ediyor. Sistem, özellikle zamirleri görsel bağlantı noktası olarak kullanarak, karakterlere zamirle atıfta bulunulduğunda önceki karelerdeki görsel kimliği aktarıyor. Bu seçici yaklaşım, gereksiz hesaplama yükünden kaçınırken karakter stabilitesi ve görsel kaliteyi artırıyor. Gelişme, dijital içerik üretimi ve eğlence sektöründe devrim yaratabilecek potansiyele sahip.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Mobil Cihazlarda Ultra Gerçekçi Dijital Avatarlar Artık Mümkün

Araştırmacılar, yüksek kaliteli dijital insanları mobil cihazlarda çalıştırabilecek yeni bir teknoloji geliştirdi. MUA (Mobile Ultra-detailed Animatable Avatars) adlı sistem, daha önce sadece güçlü sunucu bilgisayarlarda mümkün olan gerçekçi avatar animasyonlarını VR başlıkları gibi sınırlı kaynaklara sahip cihazlarda da çalıştırabiliyor. Sistem, dalga tabanlı çok seviyeli uzamsal faktörize karışım şekilleri kullanarak hem yüksek görsel kaliteyi hem de düşük hesaplama maliyetini aynı anda başarıyor. Bu gelişme, sanal gerçeklik, oyun ve dijital iletişim alanlarında önemli ilerlemeler sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

FlowC2S: Video devamı üretiminde hız ve bellek verimliliği için yeni yaklaşım

Araştırmacılar, video devamı üretimi için FlowC2S adlı yeni bir yöntem geliştirdi. Bu teknik, mevcut video karelerinden sonraki kareleri tahmin ederken bellek kullanımını yarı yarıya azaltıyor ve işlem hızını artırıyor. Geleneksel yöntemlerin aksine, FlowC2S mevcut kareler ile gürültü kombinasyonu yerine doğrudan akış alanları kullanarak çalışıyor. Yöntem, zamansal olarak bitişik video parçalarını optimal eşleştirmeler için pratik bir vekil olarak kullanıyor ve daha düz akışlar elde ediyor. Hedef inversiyonu tekniğiyle de görsel kaliteyi artırıyor. LTXV ve Wan modellerinden ince ayar yapılarak geliştirilen sistem, mevcut en iyi performansı aşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Live Avatar: Sesle Kontrol Edilen Gerçek Zamanlı Dijital Karakterler Geliştirildi

Araştırmacılar, ses komutlarıyla kontrol edilen dijital avatarları gerçek zamanlı olarak oluşturabilen Live Avatar teknolojisini geliştirdi. 14 milyar parametreye sahip yapay zeka modeli, saniyede 45 kare hızında çalışarak saatlerce kesintisiz avatar etkileşimi sağlayabiliyor. Teknoloji, mevcut difüzyon modellerinin sıralı işlem yapma zorunluluğunu aşarak, her GPU'ya farklı zaman adımları atayan yenilikçi bir paralel işleme yaklaşımı kullanıyor. Bu gelişme, video konferans, oyun, eğitim ve sosyal medya platformları için devrim niteliğinde uygulamalar sunuyor. Sistem, 10.000 saniyeyi aşan sürelerde bile görsel kalite kaybı yaşamadan çalışabiliyor ve kimlik kayması sorununu çözmüş durumda.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

3D Modellerde Gizli Veri Saklama: Yeni Steganografi Tekniği Geliştirildi

Araştırmacılar, 3D Gaussian Splatting teknolojisini kullanarak oluşturulan üç boyutlu modeller içerisine büyük miktarlarda veri saklayabilen yeni bir steganografi yöntemi geliştirdi. 'Splats in Splats++' adı verilen bu teknik, 3D ve 4D içerikleri görsel kaliteyi bozmadan gizli şekilde saklayabilmekte. Yöntem, telif haklarının korunması ve dijital varlıkların güvenliğinin artırılması açısından önemli. Spherical Harmonics frekans dağılımı analizine dayanan sistem, mevcut rendering pipeline'ını bozmadan çalışabiliyor ve yapısal değişikliklere karşı dayanıklılık gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Video düzenleme yapay zekası için kapsamlı test platformu geliştirildi

Yapay zeka destekli video üretimi giderek yaygınlaşırken, profesyonel kalitede video düzenleme sistemlerinin objektif değerlendirilmesi kritik bir ihtiyaç haline geldi. Araştırmacılar bu sorunu çözmek için VEFX-Bench adlı kapsamlı bir test platformu geliştirdi. Platform, 5.049 video düzenleme örneği içeren ve insan uzmanlar tarafından etiketlenmiş büyük ölçekli bir veri seti sunuyor. Sistem, video düzenleme kalitesini talimat takibi, görsel kalite ve düzenleme özgünlüğü olmak üzere üç farklı boyutta değerlendiriyor. Bu gelişme, yapay zeka video düzenleme teknolojilerinin standardize edilmiş şekilde karşılaştırılmasına olanak tanıyarak, sektörün daha hızlı gelişimine katkı sağlayacak.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka videoları artık nesne değişimlerini anlıyor mu? Yeni test sistemi açıkladı

Metinden video üreten yapay zeka modelleri görsel kalite açısından büyük mesafe kat etti, ancak eylemlerin nesneler üzerindeki etkilerini ne kadar doğru anlayabiliyorlar? Araştırmacılar bu soruyu yanıtlamak için OSCBench adlı yeni bir değerlendirme sistemi geliştirdi. Sistem, patates soyma veya limon dilimleme gibi mutfak eylemlerinde nesnelerin durumunun nasıl değiştiğini yapay zekanın ne ölçüde kavrayabildiğini ölçüyor. Altı farklı yapay zeka modeli üzerinde yapılan testler, mevcut teknolojinin nesne durum değişikliklerini anlama konusunda henüz gelişime açık olduğunu ortaya koydu. Bu çalışma, görsel kalitesi yüksek videolar üretebilen yapay zekanın eylem-sonuç ilişkilerini kavrama becerisini değerlendirmenin önemini vurguluyor.

arXiv (CS + AI) 0