“görüntü arama” için sonuçlar
3 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
Yapay Zeka Tibet Sanatının Sırlarını Çözmeye Başladı
Araştırmacılar, Tibet'in geleneksel Thangka resim sanatı için özel olarak tasarlanmış yeni bir yapay zeka veri seti geliştirdi. CIRThan adlı bu veri seti, hem çizim hem de metin ipuçlarını birleştirerek karmaşık dini sembolleri tanıyabilen görüntü arama sistemi oluşturuyor. 2.287 yüksek kaliteli Thangka resmi, elle çizilmiş eskizler ve üç farklı anlam düzeyinde açıklamalarla eşleştirilerek hazırlanan koleksiyon, kültürel sanat eserlerinde yapay zeka uygulamaları için önemli bir adım. Bu çalışma, geleneksel sanatlardaki zengin simgesel dili dijital ortamda anlamlandırma konusunda yeni olanaklar sunuyor.
Yapay zeka görüntü arama sistemlerinde gürültü sorununa yeni çözüm
Araştırmacılar, hem görüntü hem de metin kullanarak arama yapabilen yapay zeka sistemlerindeki önemli bir sorunu çözmek için yeni bir yöntem geliştirdi. Bileşik Görüntü Arama (CIR) sistemleri, kullanıcıların bir referans görüntü ve açıklayıcı metin kombinasyonu ile hedef görüntüleri bulmalarına olanak tanıyor. Ancak bu sistemlerde etiketleme hatalarından kaynaklanan 'gürültü' problemi, arama doğruluğunu ciddi şekilde etkiliyor. Yeni geliştirilen INTENT yöntemi, gürültüyü iki kategoriye ayırarak ele alıyor: modaliteler arası uyumsuzluk gürültüsü ve modalite-içi gürültü. Bu yaklaşım, hem farklı veri türleri arasındaki hatalı eşleştirmeleri hem de görüntü içindeki gereksiz görsel faktörleri filtreleyerek sistem performansını artırıyor. Çalışma, gelecekte daha güvenilir multimodal arama sistemlerinin geliştirilmesine katkı sağlayacak.
Çizim ve Metin Birleşerek Görüntü Arama Teknolojisinde Yeni Dönem Açıyor
Araştırmacılar, el çizimi eskizler ve metin açıklamalarını birleştiren yeni bir görüntü arama sistemi geliştirdi. STBIR adlı bu framework, eskizlerin yapısal detaylarını metnin renk ve doku bilgileriyle harmanlayarak, geleneksel arama yöntemlerinden çok daha hassas sonuçlar elde ediyor. Sistem, değişken kalitedeki sorguları işleyebilmek için öğrenme müfredatı tabanlı sağlamlık modülü kullanıyor ve kategori bilgisine dayalı özellik uzayı optimizasyonuyla model performansını artırıyor. Bu yenilikçi yaklaşım, farklı veri türlerinin güçlü yönlerini birleştirerek görüntü arama teknolojisinde önemli bir ilerleme kaydediyor.