"görüntü sınıflandırma" için 433 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
433 haber
Yapay zeka modelleri artık görsel arama motorlarında da ustalaşıyor
Araştırmacılar, dil ve görsel yetenekleri birleştiren yapay zeka modellerinin, görsel arama sistemlerinde beklenmedik başarı gösterdiğini keşfetti. Bu modeller, herhangi bir özel eğitim almadan benzer görselleri bulma konusunda uzman sistemleri geride bırakıyor. Çalışma, çok modlu dil modellerinin sadece metin-görsel işlemlerde değil, salt görsel görevlerde de güçlü olduğunu ortaya koyuyor. Özellikle karmaşık, gürültülü ortamlarda ve küçük nesnelerin bulunduğu görüntülerde daha dayanıklı sonuçlar veriyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Tıbbi Metinleri Analiz Ederken Kendi Sınırlarını Öğreniyor
Araştırmacılar, tıbbi metin analizi için yeni bir yapay zeka sistemi geliştirdi. L2D-Clinical adlı bu sistem, ne zaman uzmanlaşmış BERT modellerini, ne zaman ise büyük dil modellerini kullanması gerektiğini kendi kendine öğrenebiliyor. Sistem, belirsizlik sinyallerini ve metin özelliklerini analiz ederek hangi durumda hangi modelin daha başarılı olacağını tahmin ediyor. İlaç yan etkisi tespiti ve tedavi sonucu sınıflandırması gibi görevlerde test edilen sistem, tek bir model kullanmaya kıyasla daha yüksek doğruluk oranları elde etti. Bu yaklaşım, tıbbi yapay zeka uygulamalarında farklı modellerin güçlü yanlarını birleştirerek daha güvenilir sonuçlar elde etmeyi mümkün kılıyor.
arXiv (CS + AI) · 29 gün önce
1
MOONSHOT: Yapay Zeka Modellerini Sıkıştırma Sanatında Çoklu Hedef Yaklaşımı
Araştırmacılar, milyarlarca parametreli yapay zeka modellerini yeniden eğitmeden küçültebilen yeni bir framework geliştirdi. MOONSHOT adlı bu sistem, mevcut model sıkıştırma yöntemlerinin tek hedefli yaklaşımlarının yetersizliklerini gidererek, hem katman bazında yeniden yapılandırma hatalarını hem de eğitim kaybının matematiksel yaklaşımlarını aynı anda optimize ediyor. Bu çoklu hedefli strateji, farklı mimarilerde ve sıkıştırma seviyelerinde daha tutarlı sonuçlar veriyor. Framework, mevcut budama algoritmalarının etrafına sarılabilen esnek bir yapıya sahip ve büyük dil modellerinden görüntü işleme modellerine kadar geniş bir yelpazede kullanılabiliyor.
arXiv (CS + AI) · 29 gün önce
0
Dronlar için AI Destekli Güvenli İniş Sistemi Geliştirildi
Araştırmacılar, otonom kargo dronlarının kentsel alanlarda güvenli paket teslimatı yapabilmesi için yenilikçi bir yapay zeka sistemi geliştirdi. 'See&Say' adlı bu sistem, görsel algı ve dil modellerini birleştirerek dronların iniş yapacakları alanları dinamik olarak değerlendiriyor. Geleneksel yaklaşımlar sadece geometrik analiz veya görüntü segmentasyonuna odaklanırken, yeni sistem her iki yöntemi entegre ederek daha güvenilir karar verme sağlıyor. Sistem, tek kamerayla çekilen görüntülerdeki derinlik gradyanlarını açık-kelime dağarcığı algılama maskeleriyle birleştirerek güvenlik haritaları oluşturuyor. Bu teknolojik gelişme, kargo dronlarının karmaşık şehir ortamlarında güvenli teslimat yapabilmesi için kritik bir adım.
arXiv (CS + AI) · 29 gün önce
0
Video Sıkıştırmada Yapay Zeka için Yeni Esnek Yaklaşım: PAT-VCM
Araştırmacılar, makine öğrenmesi sistemleri için video sıkıştırma teknolojisinde önemli bir yenilik geliştirdi. PAT-VCM adlı yeni sistem, farklı yapay zeka görevleri için ayrı ayrı video kodlayıcı eğitme ihtiyacını ortadan kaldırıyor. Geleneksel yöntemler her görev için özel sıkıştırma algoritması gerektirirken, bu sistem tek bir temel video akışını hafif 'yardımcı tokenlar' ile destekleyerek çoklu görevlerde kullanılabiliyor. Sistem, görsel kalıntı tokenları, kontrol tokenları ve anlamsal tokenlar olmak üzere üç tür yardımcı bilgi türünü destekliyor. Nesne tespiti, derinlik tahmin etme ve görüntü segmentasyonu gibi farklı görevlerde test edilen sistem, her görev için ayrı model eğitme maliyetini azaltırken performansı koruyor. Bu yaklaşım, yapay zeka sistemlerinin video analizi yeteneklerini daha verimli hale getirerek endüstriyel uygulamalarda önemli bir adım teşkil ediyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay zeka modellerinin 'kara kutu' sorunu için yeni çözüm: Katmanlar arası kod çeviriciler
Yapay zeka araştırmacıları, Vision Transformer modellerinin nasıl çalıştığını anlamamızı sağlayacak yeni bir yöntem geliştirdi. 'Katmanlar Arası Kod Çeviriciler' (CLT) adı verilen bu teknik, görüntü işleyen AI modellerinin her katmanının nasıl kararlar aldığını görünür hale getiriyor. Geleneksel yöntemler sadece tek katmanları inceleyebiliyorken, CLT tüm katmanlar arasındaki etkileşimleri analiz edebiliyor. Bu gelişme, AI modellerinin daha güvenilir ve anlaşılabilir olmasını sağlayarak, özellikle kritik uygulamalarda yapay zekanın nasıl çalıştığını açıklamamıza yardımcı oluyor. Araştırmacılar, bu yöntemin AI'nın 'kara kutu' problemini çözmede önemli bir adım olduğunu belirtiyor.
arXiv (CS + AI) · 29 gün önce
0
Şehirleri çok spektrumlu gözle görmek: Bisikletlerle toplanan devrim niteliğinde veri seti
Hollandalı bilim insanları, iklim değişikliğine dayanıklı şehirler tasarlamak için yenilikçi bir yaklaşım geliştirdi. Bisikletlere monte edilen özel kameralarla sokak seviyesinden toplanan 17.718 çok spektrumlu görüntü, şehirlerin sadece görünür ışıkla değil, yakın kızılötesi ve termal spektrumlarla da nasıl göründüğünü ortaya koyuyor. Bu devrim niteliğindeki Spectrascapes veri seti, köyden büyük şehre kadar farklı yerleşim türlerinden toplanarak, şehir plancılarına ve iklim araştırmacılarına benzersiz bir perspektif sunuyor. Geleneksel uydu görüntüleri ve manuel incelemelerinin sınırlarını aşan bu yöntem, yüksek çözünürlüklü mekânsal ve zamansal veri sağlıyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Modelleri Neden Nesnelerin Yönünü Anlayamıyor?
Çok modlu büyük dil modelleri (MLLM'ler), görüntülerdeki nesnelerin 2D yönelimini belirleme konusunda ciddi zorluklar yaşıyor. Yeni bir araştırma, bu sorunun kaynağını araştırarak görsel kodlayıcıların rolünü inceliyor. CLIP ve SigLIP gibi yaygın kullanılan kodlayıcıların, geometrik akıl yürütme yerine görüntü-metin anlamsal hizalama için eğitilmiş olmasının bu başarısızlığın temel nedeni olabileceği hipotezi test ediliyor. Araştırmacılar, LLaVA OneVision ve Qwen2.5-VL gibi modellerden elde edilen kodlayıcı temsillerinin rotasyon bilgisini koruyup korumadığını ölçmek için kontrollü deneysel protokoller tasarlıyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Gözünde Büyük Yanılsama: Doğru Yeri Buluyor, Yanlış İsim Veriyor
Araştırmacılar, görüntü segmentasyonunda çalışan yapay zeka modellerinin şaşırtıcı bir hata türü keşfetti. Bu modeller, nesnelerin sınırlarını doğru tespit edebiliyor ancak tamamen yanlış etiketler atayabiliyor. Örneğin bir köpeği bulup sınırlarını çiziyor ama 'kedi' diyor. Bu durum, modellerin eğitim verilerindeki sahte korelasyonlara dayanmasından kaynaklanıyor. Cornell Üniversitesi araştırmacıları, bu 'semantik etiket takası' sorununun geleneksel değerlendirme yöntemleriyle fark edilmediğini gösterdi. Çalışma, yapay zekanın gerçek dünya uygulamalarında karşılaşabileceği kritik güvenilirlik sorunlarına ışık tutuyor.
arXiv (CS + AI) · 29 gün önce
0
3D Gaussian Splatting Artık Multispektral: Görsel Gerçeklik Bir Adım İleri
Araştırmacılar, 3D görüntü sentezleme teknolojisi olan Gaussian Splatting'i multispektral verilerle geliştirerek, sadece görünür ışık değil tüm dalga boylarını işleyebilen yeni bir sistem oluşturdular. MSGS adı verilen bu yöntem, her Gaussian nesneyi spektral parlaklık bilgileriyle zenginleştiriyor ve RGB ile multispektral sinyalleri birleştiren ikili kayıp fonksiyonu kullanıyor. Sistem, renk dönüşümünü piksel seviyesinde gerçekleştirerek daha zengin spektral bilgileri koruyabiliyor. Özellikle yarı saydam malzemeler ve anizotropik yansımalar içeren zorlu sahnelerde başarılı sonuçlar veriyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka Artık 'Bilmiyorum' Diyebiliyor: Metin Sınıflandırmada Belirsizlik Tahmini
Araştırmacılar, yapay zeka sistemlerinin metin sınıflandırmasında belirsizliklerini tahmin edebilmesi için yeni bir yöntem geliştirdi. HolUE adlı bu yaklaşım, sistemin ne zaman hata yapabileceğini önceden tahmin ederek, bilinmeyen durumlarla karşılaştığında 'bilmiyorum' diyebilmesini sağlıyor. Yöntem, iki temel belirsizlik kaynağını ele alıyor: kullanıcının belirsiz sorularından kaynaklanan 'metin belirsizliği' ve veri dağılımındaki belirsizliklerden kaynaklanan 'galeri belirsizliği'. Test sonuçları oldukça etkileyici - farklı veri setlerinde mevcut yöntemlere göre %40 ile %365 arasında iyileşme sağlandı. Bu gelişme, özellikle güvenilir yapay zeka sistemleri için kritik önem taşıyor.
arXiv (CS + AI) · 32 gün önce
0