"görüntü sınıflandırma" için 433 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
433 haber
Yapay Zeka İçin Dev Veri Seti: 90 Bin Fotoğrafla 3D Görsel Üretimi
Araştırmacılar, yapay zekanın gerçekçi 3D görseller üretebilmesi için DF3DV-1K adlı kapsamlı bir veri seti geliştirdi. 1.048 farklı mekan ve toplam 89.924 fotoğraf içeren bu koleksiyon, her sahne için hem temiz hem de karışık görüntüler sunuyor. Tüketici kameralarıyla çekilen fotoğraflar, günlük kullanım koşullarını taklit ediyor ve 128 farklı dikkat dağıtıcı öğe ile 161 mekan teması kapsıyor. Veri seti, yapay zekanın farklı açılardan yeni görüntüler sentezleyebilmesini sağlayan radiance field teknolojilerinin gelişimi için kritik öneme sahip. İç ve dış mekan ortamlarını kapsayan bu kaynak, özellikle karışık ortamlarda bile temiz görüntüler üretebilen sistemlerin test edilmesi amacıyla tasarlandı.
arXiv (CS + AI) · 29 gün önce
0
VibeFlow: Videoların Renk ve Işığını Yapay Zeka ile Düzenlemeye Yeni Yaklaşım
Araştırmacılar, videoların renk ve aydınlatmasını değiştirmek için VibeFlow adlı yeni bir yapay zeka sistemi geliştirdi. Bu teknoloji, pahalı eğitim verilerine ihtiyaç duymadan, önceden eğitilmiş video üretim modellerinin fiziksel anlayışını kullanıyor. Sistem, videonun yapısal bütünlüğünü korurken renk ve ışık özelliklerini referans görüntülerden alarak değiştirebiliyor. Geleneksel yöntemlerin aksine, VibeFlow kendi kendini eğiten bir yaklaşım benimsiyor ve video editörlüğünde önemli bir ilerleme sunuyor. Teknoloji, film endüstrisi ve içerik üretiminde geniş uygulama alanları bulabilir.
arXiv (CS + AI) · 29 gün önce
1
Yapay zeka modellerinde büyüme: Görev türü değil, veri kalitesi kilit
Araştırmacılar, çok modlu büyük dil modellerinin (MLLM) gelişimindeki temel engelin görev çeşitliliği değil, eğitim verilerinin bilgi yoğunluğu olduğunu ortaya koydu. Çalışma, görsel soru yanıtlama (VQA) gibi özel görevlerin, görüntü açıklamalarının ötesinde çok az ek bilgi sağladığını gösteriyor. VQA sinyalleri, açıklamalardan minimal performans kaybıyla yeniden oluşturulabiliyor. Bunun yerine, yapılandırılmış açıklama zenginleştirme ve çapraz-modal bilgi enjeksiyonu yoluyla bilgi yoğunluğunun artırılması, hem çok modlu hem de alt akım ölçütlerde tutarlı performans iyileştirmeleri sağlıyor. Bu bulgular, AI modellerinin ölçeklendirme stratejilerinde paradigma değişikliği önerebilir.
arXiv (CS + AI) · 29 gün önce
0
İş dünyası için yapay zeka değerlendirme platformu WorkRB geliştirildi
Günümüzde işe alım süreçleri, yetenek yönetimi ve işgücü analitiği giderek daha fazla yapay zeka destekli öneri sistemlerine dayanıyor. Ancak bu alandaki araştırmalar dağınık ve karşılaştırma yapmak zorlaşıyor. Farklı sınıflandırma sistemleri, çeşitli görev tanımları ve model yaklaşımları kullanılması, çalışmaları birbiriyle kıyaslanabilir olmaktan çıkarıyor. Araştırmacılar, bu soruna çözüm olarak WorkRB adında açık kaynaklı bir değerlendirme platformu geliştirdi. Platform, iş alanına özel yapay zeka uygulamalarını test etmek için özel olarak tasarlandı ve topluluk odaklı bir yaklaşım benimsiyor. Bu çalışma, sektördeki parçalanmışlık sorununa çözüm getirerek, yapay zeka teknolojilerinin iş dünyasındaki performansını daha objektif şekilde değerlendirme imkanı sunuyor.
arXiv (CS + AI) · 29 gün önce
0
OmniTrace: Yapay Zeka Modellerinin Kaynak Takibi İçin Yeni Çerçeve
Araştırmacılar, çok modlu büyük dil modellerinin (MLLM) ürettiği yanıtların hangi kaynaklardan geldiğini izleyebilen yeni bir sistem geliştirdi. OmniTrace adlı bu hafif çerçeve, metin, görüntü, ses ve video girişlerini aynı anda işleyebilen yapay zeka modellerinde kaynak atıfı sorununu çözmeyi hedefliyor. Mevcut atıf yöntemleri genellikle tek modalite veya sınıflandırma görevleri için tasarlanmış durumda. OmniTrace ise üretim sırasında her bir token'ın hangi girişten geldiğini takip ederek, anlam bütünlüğü olan açıklamalar sunuyor. Bu gelişme, yapay zeka sistemlerinin güvenilirliği ve şeffaflığı açısından önemli bir adım olarak görülüyor.
arXiv (CS + AI) · 29 gün önce
0
Dronelar için Hafif Görüntü Kalitesi Değerlendirme Sistemi Geliştirildi
Araştırmacılar, insansız hava araçları (drone) ile çekilen görüntülerin kalitesini otomatik olarak değerlendiren yeni bir sistem geliştirdi. MM-IQA adı verilen bu framework, bulanıklık, kenar yapısı, düşük çözünürlük, pozlama dengesizliği, gürültü ve sis gibi çoklu metrikleri kullanarak 0-100 arasında kalite puanı veriyor. Özellikle referans görüntünün bulunmadığı durumlarda çalışabilen bu hafif sistem, büyük hacimli görüntü setlerinin otomatik filtrelenmesinde kritik öneme sahip. Beş farklı veri setinde yapılan testlerde 0.647 ile 0.830 arasında korelasyon değerleri elde eden sistem, tarımsal uygulamalar başta olmak üzere drone görüntülemesinin yaygın olduğu alanlarda verimlilik sağlayacak.
arXiv (CS + AI) · 29 gün önce
0
Müzik Melodilerinin Şekilleri Aslında Kategorilere Ayrılmıyor
Müzikologlar uzun yıllardır melodi şekillerini sınıflandırmak için belirli tip kategorileri kullanıyor. Ancak yeni bir araştırma, bu yaklaşımın temelini sarsan bulgular ortaya koydu. Araştırmacılar, Alman ve Çin halk şarkıları ile Gregoryen ilahilerini analiz ederek, melodi konturlarının aslında ayrık kategorilere ayrılmadığını keşfetti. UMAP boyut azaltma ve dist-dip çok modluluk testini kullanan bilim insanları, sentetik veri setlerinde kümeleme tespit edebildiklerini ancak gerçek melodi örneklerinde böyle bir yapı bulamadıklarını belirtti. Bu bulgular, müzik teorisinde yaygın kullanılan Huron tipolojisi gibi sınıflandırma sistemlerinin güvenilirliğini sorguluyor. Sonuç olarak melodik konturun, keskin sınırları olan kategorilerden ziyade sürekli bir olgu olarak ele alınması gerektiği öneriliyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Modelleri Artık Öğrendiklerini Seçerek Unutabilecek
Araştırmacılar, derin öğrenme modellerinin belirli bilgileri seçici ve güvenli şekilde unutmasını sağlayan yeni bir algoritma geliştirdi. Graph-Propagated Projection Unlearning (GPPU) adlı bu yöntem, görüntü ve ses işleme modellerinde istenmeyen sınıf bilgilerini kalıcı olarak silmeyi mümkün kılıyor. Sistem, graf tabanlı yayılım kullanarak özellik uzayında sınıfa özgü yönleri tespit ediyor ve bu bilgileri dik alt uzaya yansıtarak etkisiz hale getiriyor. Altı görüntü veri seti ve iki büyük ses veri seti üzerinde yapılan testlerde, GPPU'nun mevcut yöntemlere göre 10-20 kat daha hızlı çalıştığı ve hem CNN hem de Transformer mimarilerinde başarılı sonuçlar verdiği görüldü. Bu gelişme, veri mahremiyeti düzenlemeleri ve uyarlanabilir sistem tasarımı açısından büyük önem taşıyor.
arXiv (CS + AI) · 29 gün önce
0
Japon araştırmacılar yapay zeka için panoramik 3D veri seti geliştirdi
Fukuoka Üniversitesi araştırmacıları, yapay zeka algoritmalarının dış mekan ortamlarını daha iyi tanımlayabilmesi için kapsamlı bir panoramik 3D veri seti geliştirdi. İki farklı veri seti içeren bu çalışma, orman, sahil, yerleşim yeri, şehir merkezi ve park alanları gibi altı farklı kategoriyi kapsıyor. İlk veri seti 9 milyon noktalık yoğun 3D taramalar içerirken, ikincisi araç üzerinde gerçek zamanlı olarak toplanan 70 bin noktalık seyrek verilerden oluşuyor. Araştırmacılar bu verileri kullanarak yapay zeka modellerini test ettiklerinde, yoğun verilerle %96,42, seyrek verilerle %89,67 doğruluk oranına ulaştılar. Bu veri setleri, otonom sürüş teknolojilerinden robotik uygulamalara kadar birçok alanda kullanılabilecek açık kaynak olarak sunuldu.
arXiv (CS + AI) · 29 gün önce
0
PatchPoison: 3D Görüntü Rekonstrüksiyonunu Engelleyen Yeni Güvenlik Yöntemi
Araştırmacılar, kişisel gizliliği korumak için 3D görüntü rekonstrüksiyonunu engelleyen yenilikçi bir yöntem geliştirdi. PatchPoison adı verilen bu teknik, fotoğraflara küçük kareli desenler ekleyerek, bu görüntülerden izinsiz 3D model oluşturulmasını önlüyor. Yöntem, çok açılı görüntülerden yüksek kaliteli 3D modeller üreten 3D Gaussian Splatting teknolojisine karşı etkili bir koruma sağlıyor. Özellikle halka açık paylaşılan fotoğraf ve videolardan kişilerin haberi olmadan detaylı 3D modeller oluşturulması konusundaki endişelere yanıt veriyor. Bu hafif ve pratik çözüm, dijital gizlilik alanında önemli bir adım olarak değerlendiriliyor.
arXiv (CS + AI) · 29 gün önce
0
Analog optik bilgisayar 6 milyon verilik kredi onayında test edildi
Araştırmacılar, analog optik bilgisayarın gerçek dünya verilerindeki performansını test etmek için 5,84 milyon ABD mortgage kaydını kullandı. Bu çalışma, optik bilgisayarların küçük ölçekli görüntü işleme testlerinin ötesine geçen ilk büyük veri uygulaması olma özelliği taşıyor. Sonuçlar, analog optik bilgisayarın %94,6 doğruluk oranına ulaştığını, ancak XGBoost algoritmasının %97,9'luk performansının gerisinde kaldığını gösteriyor. Araştırma, optik bilgisayarlardaki doğruluk kayıplarının üç ana kaynağını belirledi: kodlama, mimari tasarım ve donanım sınırlamaları. İlginç şekilde, donanımsal kusurların performansta ölçülebilir bir etki yaratmadığı gözlendi. Bu bulgular, analog optik bilgisayarların yapay zeka uygulamalarında kullanılabilirliğini değerlendirmek için önemli veriler sunuyor.
arXiv (CS + AI) · 29 gün önce
0