“görüntü üretimi” için sonuçlar

Teknoloji & Yapay Zeka

21 Apr

EditVerse: Görsel ve video düzenlemeyi tek modelde birleştiren yapay zeka

Araştırmacılar, görüntü ve video üretimi ile düzenleme işlemlerini tek bir yapay zeka modelinde birleştiren EditVerse adlı yenilikçi bir sistem geliştirdi. Sistem, metin, görüntü ve videoyu ortak bir dil olarak işleyerek farklı formatlar arasında bilgi aktarımı sağlıyor. Video düzenleme verilerinin yetersizliğini aşmak için 232 bin video düzenleme örneği içeren özel bir veri seti oluşturan ekip, modelin farklı çözünürlük ve sürelerdeki içeriklerle esnek çalışmasını mümkün kıldı. Bu gelişme, yapay zeka alanında görsel içerik üretiminde önemli bir birleşme adımını temsil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka avatarları gerçek zamanlı konuşma becerisine kavuşuyor

Araştırmacılar, büyük dil modellerini gerçek zamanlı görsel avatarlarla buluşturan EmbodiedHead adlı yeni bir teknoloji geliştirdi. Bu sistem, yapay zekanın hem dinleme hem de konuşma sırasında doğal davranışlar sergilemesini sağlıyor. Özellikle Rectified-Flow Diffusion Transformer adlı yeni bir model kullanarak, sadece dört adımda yüksek kaliteli görsel üretim gerçekleştiriyor. Sistem, geleneksel çift ses akışı yönteminin aksine, tek ses akışı kullanarak kullanıcı-yapay zeka etkileşimini daha doğal hale getiriyor. Dinleme sırasında gereksiz ağız hareketlerini engellerken, konuşma sırası geçişlerini sorunsuz şekilde yönetebiliyor. Bu gelişme, sanal asistanlar ve dijital avatarlar için önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

UniMesh: 3D nesneleri anlama ve oluşturmayı birleştiren yapay zeka modeli

Araştırmacılar, 3D nesneleri hem anlayabilen hem de oluşturabilen UniMesh adlı yeni bir yapay zeka sistemi geliştirdi. Geleneksel yaklaşımlarda 3D görme görevleri ayrı ayrı ele alınıyor - bir model sadece nesne tanıma yaparken diğeri sadece yeni nesneler üretiyor. Bu parçalı yaklaşım, modeller arası bilgi transferini zorlaştırıyor ve bütüncül sahne modellemesini engelliyor. UniMesh bu sorunu çözmek için tek bir mimari içinde hem 3D nesne üretimi hem de anlama görevlerini birleştiriyor. Sistem, yenilikçi Mesh Head arayüzü ile görüntü üretimi ve şekil çözücüleri arasında köprü kuruyor. Ayrıca Chain of Mesh (CoM) adlı iteratif akıl yürütme yöntemiyle kullanıcıların 3D nesneleri semantik olarak düzenlemesine olanak tanıyor. Bu gelişme, 3D modellemede daha verimli ve bütünleşik çözümler sunarak bilgisayar grafikleri ve yapay zeka alanlarında önemli bir adım oluşturuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Türbülanslı Akışları Tahmin Etmek İçin Yeni Yaklaşım Geliştirdi

Araştırmacılar, türbülanslı akışlar gibi karmaşık fiziksel sistemleri modellemek için difüzyon tabanlı makine öğrenmesi yöntemlerinde önemli bir iyileştirme gerçekleştirdi. Geleneksel yaklaşımların yetersiz kaldığı yüksek boyutlu ve doğrusal olmayan dinamiklerde, görüntü üretimi için tasarlanan hedef parametreleştirme yöntemlerini fiziksel alanlar için yeniden değerlendirdiler. Yama tabanlı transformer mimarisi kullanan çalışma, türbülanslı akış simülasyonlarında test edildi. Sonuçlar, fiziksel sistemlerin karakteristik özelliklerini dikkate alan özel parametreleştirme yaklaşımlarının, standart görüntü işleme yöntemlerinden daha başarılı olduğunu gösteriyor. Bu gelişme, hava durumu tahmininden mühendislik tasımına kadar birçok alanda daha güvenilir simülasyonlar yapılmasını sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka ile plankton izleme: Çevre korumanın yeni dijital yardımcısı

Su ekosistemlerinin sağlığını değerlendirmek için kritik öneme sahip plankton izleme, geleneksel yöntemlerle oldukça zor ve zaman alıcı bir süreç. Mikroskobik analizler manuel olarak yapılırken, araştırmacılar hem zaman hem de işgücü kısıtlamasıyla karşılaşıyor. Yeni geliştirilen PlankFormer sistemi, yapay zeka teknolojilerini kullanarak bu sorunu çözmeyi hedefliyor. Sistem, kalabalık mikroskop görüntülerinde planktonları otomatik olarak tespit edip ayırt edebiliyor. En büyük zorluklardan biri, gerçek plankton örnekleriyle debris ve birbiriyle örtüşen organizmaları birbirinden ayırmak. PlankFormer, bu problemi Vision Transformer teknolojisi ve sentetik görüntü üretimi ile aşıyor. Özellikle veri yetersizliğini gidermek için yapay plankton topluluk görüntüleri oluşturuyor. Bu teknoloji, çevre bilimcilerin su kalitesi ve ekolojik değişimleri daha hızlı ve doğru şekilde izlemelerine olanak sağlayarak, çevresel korumanın dijital dönüşümünde önemli bir adım temsil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka az veriyle askeri araçları daha iyi tespit ediyor

Araştırmacılar, sınırlı veri koşullarında askeri araç tespitini iyileştirmek için yeni bir yapay zeka yaklaşımı geliştirdi. Çalışmada, sınıf başına sadece 8-24 gerçek görüntü kullanarak FLUX.1 difüzyon modeli eğitildi ve bu model yeni sentetik görüntüler üretti. Üretilen yapay görüntüler, RF-DETR tespit sisteminin performansını önemli ölçüde artırdı. Bu yaklaşım, askeri uygulamalarda sıkça karşılaşılan veri kıtlığı sorununa pratik bir çözüm sunuyor. Yöntem, mevcut sınırlı veri setini daha etkin kullanarak, ek gerçek veri toplamaya gerek kalmadan tespit doğruluğunu iyileştiriyor. Araştırma, difüzyon tabanlı görüntü üretiminin savunma teknolojilerindeki potansiyelini gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

DMF: Sürtünme Destekli Yeni Yapay Zeka Modeli Görüntü Üretiminde Devrim Yaratıyor

Araştırmacılar, yapay zeka destekli görüntü üretiminde çığır açan yeni bir model geliştirdi. DMF (Drifting Model with Friction) adlı bu sistem, sürtünme kavramını matematiksel modellemeye entegre ederek, mevcut yöntemlerden 16 kat daha az hesaplama gücüyle aynı kalitede sonuçlar üretiyor. Model, özellikle yüz görüntülerinde yaş dönüşümü gibi karmaşık işlemlerde başarılı sonuçlar veriyor. Geleneksel drift field modellerinin iki temel sorununun çözümünü sunan araştırma, Gaussian çekirdek kullanarak matematiksel olarak kanıtlanmış stabilite sağlıyor. Bu gelişme, yapay zeka modellerinin daha verimli eğitimi ve daha hızlı sonuç üretimi açısından önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

TextTIGER: Metinleri Görüntüye Dönüştüren Yapay Zeka Sisteminde Büyük Yenilik

Araştırmacılar, yazılı açıklamalardan görüntü üreten yapay zeka sistemlerinde karşılaşılan önemli bir sorunu çözmek için TextTIGER adlı yenilikçi bir yöntem geliştirdi. Sistem, metinlerde geçen kişi, yer ve nesne gibi belirli varlıkların özelliklerini daha iyi anlayarak, bu varlıkları içeren görüntüleri çok daha başarılı bir şekilde üretebiliyor. Mevcut yapay zeka modelleri, sayısız varlığın tüm detaylarını ezberleyemediği için sınırlı kalıyor. TextTIGER ise bu varlıklar hakkında dış kaynaklardan ek bilgi toplayıp, büyük dil modellerinin yardımıyla bu bilgileri özetleyerek sorunu aşıyor. Araştırmacılar özel bir veri seti oluşturarak sistemlerini test etti ve birçok farklı görüntü üretim modelinde kayda değer performans artışı elde ettiklerini gösterdi. Bu gelişme, metin tabanlı görüntü üretimi alanında önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Omni-R1: Çok Modlu Mantık Yürütmede Yeni Dönem

Araştırmacılar, görsel ve metinsel bilgileri bir arada işleyebilen yapay zeka sistemlerinde önemli bir adım attı. Omni-R1 adı verilen yeni sistem, mantık yürütme sürecinde ara görüntüler üretebilen birleşik bir yaklaşım sunuyor. Geleneksel çok modlu dil modellerinin aksine, bu sistem farklı görevler için özel kalıplar yerine evrensel bir yaklaşım benimsiyor. Sistem, görüntülerin belirli bölgelerine odaklanma veya nesneleri işaretleme gibi çeşitli yetenekleri tek bir çerçevede birleştiriyor. İki aşamalı bir eğitim süreci ve algısal hizalama teknikleri kullanan model, işlevsel görüntü üretimi konusunda yeni standartlar oluşturuyor. Bu gelişme, yapay zekanın görsel ve metinsel verileri anlama kapasitesini artırarak, eğitimden sağlık sektörüne kadar pek çok alanda uygulanabilir çözümler sunma potansiyeline sahip.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

DisCa: Video Yapay Zeka Üretiminde Hız ve Kalite Sorununa Yenilikçi Çözüm

Yapay zeka ile video üretimi alanında büyük ilerlemeler kaydedilirken, hesaplama maliyeti de hızla artıyor. Mevcut hızlandırma yöntemleri arasında özellik önbellekleme (Feature Caching) popüler olsa da, sıkıştırma artırıldığında kalite kaybı yaşanıyor. Adım-damıtma (step-distillation) yöntemi ise görüntü üretiminde başarılı olmasına rağmen video üretiminde performans düşüşü gösteriyor. Araştırmacılar bu sorunlara DisCa adlı yeni bir yaklaşım geliştirdi. Bu yöntem, geleneksel eğitimsiz sezgisel yöntemler yerine hafif bir öğrenebilir sinir ağı öngörücüsü kullanarak, damıtma uyumlu öğrenebilir özellik önbellekleme mekanizması sunuyor. Böylece hem hız artışı sağlanırken hem de video kalitesi korunabiliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Görüntü Üretiminde Hız Sorunu Çözüme Kavuşuyor

Diffüzyon modelleri yapay zeka görüntü üretiminde devrim yaratmasına rağmen, yavaş çalışma sorunu pratik kullanımlarını sınırlıyordu. Araştırmacılar, tutarlılık modellerinin eğitim kararsızlığı ve esnek olmayan örnekleme problemlerini analiz ederek yeni bir çözüm geliştirdi. Dual-End Consistency Model (DE-CM) adlı bu yöntem, kritik alt-yörünge kümelerini seçerek hem stabil hem de etkili eğitim sağlıyor. Çalışma, mevcut yöntemlerin mimari düzeltmeler ve düzenli hedeflerle sorunu çözmeye çalıştığını, ancak yörünge seçiminin kritik önemini gözden kaçırdığını ortaya koyuyor. Bu yenilik, yapay zeka tabanlı görüntü üretim teknolojilerinin daha hızlı ve güvenilir hale gelmesini sağlayarak, sanat, tasarım ve medya sektörlerinde daha yaygın kullanım imkanı sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Görüntü Üretiminde Hata Sinyallerinden Yeni Rehberlik Yöntemi

Araştırmacılar, yapay zekanın görüntü üretim sürecindeki matematiksel hataları fırsata çeviren yenilikçi bir yöntem geliştirdi. Diffüzyon modelleri olarak bilinen bu sistemlerde, hesaplama sırasında ortaya çıkan hatalar genellikle görüntü kalitesini düşürüyor. Ancak yeni yaklaşım, bu hataları rehber sinyal olarak kullanarak daha kaliteli sonuçlar elde ediyor. ERK-Guid adı verilen teknik, matematiksel çözücülerin zorlandığı 'katı bölgelerde' ortaya çıkan hataları tespit ederek bunları görüntü üretim sürecini iyileştirmek için kullanıyor. Bu buluş, yapay zekanın görüntü, video ve sanat üretimi gibi alanlarda daha başarılı olmayı sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka görsel üretim modellerini test eden yeni değerlendirme sistemi geliştirildi

Araştırmacılar, metin komutlarından görsel üreten yapay zeka modellerinin performansını daha kapsamlı şekilde değerlendiren DSH-Bench adlı yeni bir test sistemi geliştirdi. Mevcut değerlendirme yöntemleri, çok sınırlı nesne çeşitliliğine sahip olmak ve farklı zorluk seviyelerindeki performansı ayrıntılı analiz edememek gibi önemli eksikliklere sahipti. Bu yeni sistem, 58 farklı kategorideki nesneleri kapsayan hiyerarşik bir sınıflandırma yaklaşımı kullanarak, modellerin güçlü ve zayıf yönlerini daha detaylı ortaya çıkarıyor. Sistem ayrıca farklı zorluk seviyelerinde ve çeşitli senaryo türlerinde model performansını ayrı ayrı değerlendirerek, geliştiricilere modellerini nasıl iyileştirebilecekleri konusunda somut rehberlik sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Zayıf Öğretmenle Güçlü Öğrenci: Yapay Zeka Eğitiminde Devrim

Araştırmacılar, yapay zeka modellerinin eğitim süresini dramatik şekilde kısaltan yeni bir yöntem geliştirdi. Geleneksel bilgi aktarım yöntemlerinin tersine, bu yaklaşım daha zayıf bir 'öğretmen' modeli kullanarak güçlü öğrenci modellerin eğitimini hızlandırıyor. Yöntem, eğitimin sadece erken aşamalarında zayıf öğretmenden bilgi aktarımı yapıyor ve öğrenci öğretmeni geçtiğinde bu süreci durduruyor. ImageNet ve CIFAR veri setlerinde 4,8 kata kadar hızlanma sağlanırken, nesne tespiti ve görüntü üretimi gibi farklı alanlarda da başarılı sonuçlar alındı. Bu buluş, büyük ölçekli görsel öğrenmenin maliyetini önemli ölçüde azaltabilecek potansiyele sahip.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Görüntü Üretiminde Yeni Token Düzenleme Yöntemi Keşfedildi

Araştırmacılar, yapay zeka modellerinin görüntü üretme sürecinde kullandığı token yapılarının nasıl optimize edilebileceğini araştırdı. Geleneksel 2D ızgara sistemi yerine, kaba detaydan ince detaya doğru çalışan 1D sıralı token sisteminin, test aşamasında çok daha etkili sonuçlar verdiği keşfedildi. Bu yenilikçi yaklaşım, ara aşamalardaki durumların anlamlı bilgi taşımasını sağlayarak, doğrulama algoritmalarının daha güvenilir değerlendirmeler yapmasına olanak tanıyor. Bulgular, gelecekte daha akıllı ve kontrol edilebilir görüntü üretim sistemlerinin geliştirilmesi için önemli bir adım oluşturuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Artık Frekans Bilinci ile Daha Gerçekçi Görüntüler Üretiyor

Stanford araştırmacıları, yapay zekanın görüntü üretim kalitesini artıran yeni bir yöntem geliştirdi. FreqFlow adı verilen bu teknik, görüntülerdeki farklı frekans bileşenlerinin nasıl işlendiğini dikkate alarak çalışıyor. Geleneksel flow matching modelleri önce genel yapıyı, sonra detayları oluşturur. Yeni yöntem ise düşük frekanslı (genel yapı) ve yüksek frekanslı (ince detaylar) bileşenleri ayrı ayrı işleyerek bu süreci optimize ediyor. İki dalı bulunan mimari sayesinde hem global yapıyı hem de dokular ve kenarlar gibi detayları daha başarılı bir şekilde yakalayabiliyor. Bu yaklaşım, yapay zeka tarafından üretilen görsellerin gerçekçiliğini önemli ölçüde artırıyor ve görüntü üretim teknolojisinde yeni bir standart oluşturabileceği değerlendiriliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Video Yapay Zekası Daha Hızlı: Diffusion Modellerinde Verimlilik Devrimi

Video üretimi yapay zeka alanında hızla gelişen bir teknoloji olmakla birlikte, yüksek hesaplama maliyetleri pratikte kullanımını sınırlıyor. Araştırmacılar, video diffusion modellerinin verimliliğini artırmak için dört ana yaklaşım geliştirmiş durumda. Bu yöntemler arasında adım damıtması, verimli dikkat mekanizmaları, model sıkıştırma ve önbellek optimizasyonu yer alıyor. Görüntü üretimine kıyasla video sentezi, hem uzamsal-zamansal boyutlarda büyüyen veri miktarı hem de iteratif gürültü giderme süreçleri nedeniyle çok daha karmaşık hesaplamalar gerektiriyor. Bu durum, dikkat mekanizmalarını ve bellek trafiğini ana darboğaz noktaları haline getiriyor. Yeni araştırmalar, bu zorlukları aşmak için işlev değerlendirmesi sayısını azaltma ve her adımdaki hesaplama yükünü minimize etme hedefleriyle çeşitli algoritmik çözümler sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Görüntü Üretimindeki Gizli Sorun: SNR-t Yanlılığı Keşfedildi

Araştırmacılar, yapay zekanın görüntü üretiminde kullandığı difüzyon modellerinde kritik bir sorun keşfetti. Bu modeller eğitim ve çıkarım aşamalarında sinyal-gürültü oranının zaman adımlarıyla uyumsuzluğa düştüğünü gözlemlediler. SNR-t yanlılığı olarak adlandırılan bu fenomen, modellerin ürettiği görüntülerin kalitesini düşürüyor ve hata birikimine neden oluyor. Araştırma ekibi, bu sorunu çözmek için diferansiyel düzeltme yöntemi önerdi. Bulgular, yapay zeka tabanlı görüntü üretim teknolojilerinin gelişimi açısından önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka kişi tanımada gerçek veri ihtiyacını ortadan kaldırıyor

Araştırmacılar, metin tabanlı kişi tanıma sistemleri için tamamen sentetik veri kullanmanın etkinliğini araştıran kapsamlı bir çalışma gerçekleştirdi. Geleneksel yöntemler, gerçek kişi fotoğrafları ve manuel açıklamalar gerektirdiği için mahremiyet endişeleri ve yüksek maliyetler doğururken, yeni yaklaşım bu sorunları çözmeyi hedefliyor. Çalışma, gerçek veriye hiç ihtiyaç duymadan çeşitli kimlik merkezli görüntüler üretebilen birleşik bir sentetik veri üretim pipeline'ı öneriyor. Bu yaklaşım, otomatik prompt oluşturma stratejileri kullanarak sınıflar arası görüntü üretimi gerçekleştiriyor. Araştırma, sentetik verinin çeşitli gerçek dünya senaryolarındaki etkinlik sınırlarını sistematik olarak incelemeyi amaçlıyor ve bu alanda ilk kapsamlı deneysel çalışma niteliği taşıyor.

arXiv (CS + AI) 0