"görsel muhakeme" için 460 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
460 haber
Yapay Zeka Öğrenmede Devrim: Beynin Öğrenme Yöntemini Taklit Eden Yeni Model
Araştırmacılar, geleneksel yapay zeka öğrenme yöntemlerinden farklı olarak insan beyninin çalışma prensiplerini taklit eden yeni bir görsel tanıma modeli geliştirdi. Multi-Frequency Local Plasticity adı verilen bu sistem, beynin yerel öğrenme mekanizmalarından ilham alarak çalışıyor. Model, sabit Gabor filtreleri, rekabetçi öğrenme algoritmaları ve modern Hopfield ağlarını birleştiriyor. En dikkat çekici özelliği ise tüm sistem boyunca geri yayılım algoritması kullanmadan öğrenebilmesi. Bu yaklaşım, yapay zekanın daha az enerji tüketen ve biyolojik sistemlere daha yakın çalışma prensipleriyle geliştirilmesine olanak tanıyor. Araştırma, hem yapay zeka hem de beyin bilimi alanlarında önemli bir adım olarak değerlendiriliyor.
arXiv (CS + AI) · 27 gün önce
0
Yapay Zeka Modelleri Artık Görsel ve Metinsel Bilgileri Daha Hızlı İşleyebilecek
Araştırmacılar, yapay zeka modellerinin görsel ve metinsel bilgileri birlikte işleme kapasitesini artıran yeni bir yöntem geliştirdi. Çalışma, mevcut çok modlu AI sistemlerinin görsel verileri yetersiz işlediğini ve karmaşık görevlerde zorlandığını ortaya koyuyor. Geliştirilen 'görsel tekrar modülü' ve 'derinlik ölçeklendirme' teknikleri, modellerin hem görüntüleri daha iyi anlamasını hem de karmaşık mantıksal işlemleri daha hızlı gerçekleştirmesini sağlıyor. Bu yenilik, özellikle görsel soru cevaplama sistemleri ve akıllı asistanlar için önemli performans artışları vaat ediyor.
arXiv (CS + AI) · 27 gün önce
0
Yapay Zeka Değerlendirmesinde Devrim: Tek Seferde Çoklu Yanıt Puanlama
Araştırmacılar, yapay zeka modellerinin ürettiği yanıtları değerlendirmek için yeni bir yöntem geliştirdi. Geleneksel sistemler her yanıtı ayrı ayrı inceleyerek zaman kaybına neden olurken, yeni yaklaşım birden fazla yanıtı tek seferde karşılaştırıp puanlayabiliyor. Bu yöntem, yanıtları özel ayırıcı tokenlarla birleştirerek doğrudan karşılaştırmalı akıl yürütme imkanı sunuyor. Sistem, N adet yanıt için N kat hızlanma ve hesaplama maliyetinde ciddi azalma sağlıyor. Araştırma kapsamında iki yeni benchmark oluşturuldu: MR²Bench-Image görsel içerik için 8 farklı modelin yanıtlarını insan değerlendirmeleriyle karşılaştırırken, MR²Bench-Video 94 bin kişinin video tabanlı soru-cevap değerlendirmelerinden oluşuyor. Bu gelişme, yapay zeka modellerinin performansını daha hızlı ve verimli değerlendirme imkanı sunarak, AI sistemlerinin geliştirilmesini hızlandırabilir.
arXiv (CS + AI) · 27 gün önce
0
Yapay Zeka MR Görüntülerinden PET Taraması Üretebiliyor
Alzheimer hastalığının erken teşhisi için kullanılan PET taramaları pahalı ve radyasyon içeriyor. Araştırmacılar, MR görüntülerinden yapay zeka ile PET taraması üreten DIReCT++ sistemini geliştirdi. Bu yeni teknoloji, klinik bilgilerle desteklenen görsel-dil modelini kullanarak kişiye özel PET görüntüleri sentezleyebiliyor. Çok merkezli veri setlerinde yapılan testler, sistemin hafif bilişsel bozukluk durumlarını değerlendirmede başarılı olduğunu gösteriyor. Bu gelişme, Alzheimer'ın erken teşhisinde maliyet ve radyasyon maruziyeti sorunlarına çözüm getirebilir.
arXiv (CS + AI) · 27 gün önce
0
Yapay Zeka Artık Geometri Problemlerini Çizimden Anlayabiliyor
Araştırmacılar, yapay zekanın geometri problemlerindeki görsel algı sorununu çözmek için yeni bir yaklaşım geliştirdi. Çok modlu büyük dil modelleri (MLLM'ler) karmaşık metinleri anlayabilse de, geometrik şekilleri görsel olarak algılamakta zorlanıyordu. Yeni geliştirilen 'Geoparsing' sistemi, hem düzlem hem de katı geometriyi kapsayan birleşik bir formal dil kullanarak bu sorunu çözüyor. Sistem, 29 bin gerçek geometri örneği ile eğitildi ve denetimli öğrenme ile pekiştirmeli öğrenmeyi birleştiren hibrit bir yaklaşım kullanıyor. Bu gelişme, yapay zekanın matematik eğitiminden mühendislik uygulamalarına kadar geniş bir yelpazede kullanılabilmesinin önünü açıyor.
arXiv (CS + AI) · 27 gün önce
0
3D Gaussian Splatting'de Çığır Açan Geliştirme: Bozucu Öğeleri Kademeli Filtreleyen Sistem
Bilgisayar grafikleri dünyasında gerçek zamanlı fotorealistik görüntü oluşturma alanında önemli bir gelişme yaşanıyor. 3D Gaussian Splatting (3DGS) teknolojisi, çoklu görüntülerden 3D sahneler oluşturmada devrim yaratmış, ancak girdi görüntülerindeki tutarsızlıklar ve bozucu öğeler nedeniyle görsel bozulmalar yaşanıyordu. Araştırmacılar tarafından geliştirilen PDF-GS adlı yeni framework, bu sorunu çözmek için 3DGS'nin doğasında bulunan tutarsız sinyalleri bastırma yetisini keşfetti ve bu özelliği güçlendiren kademeli bir optimizasyon sistemi tasarladı. Sistem, bozucu öğeleri aşamalı olarak filtrelerken, sonrasında temizlenmiş verilerden ince detayları geri kazandırıyor. Bu yenilikçi yaklaşım, 3D sahne rekonstrüksiyonu ve sanal gerçeklik uygulamalarında daha güvenilir ve yüksek kaliteli sonuçlar elde edilmesini sağlıyor.
arXiv (CS + AI) · 27 gün önce
0
Çok Modlu Yapay Zeka Neden Geride Kalıyor? İç Mekanizmalar Araştırıldı
Yapay zeka modellerinin yeni görevleri örneklerden öğrenmesini sağlayan 'bağlam içi öğrenme' yöntemi, sadece metinle çalışırken başarılı olsa da görsel ve metinsel verileri birlikte işlerken zorlanıyor. Araştırmacılar, çok modlu büyük dil modellerinin neden tek modal karşılıklarından daha zayıf performans sergilediğini sistematik olarak inceledi. Bulgular, mevcut modellerin görsel ve metinsel temsiller arasında mantıksal düzeyde yeterli hizalamaya sahip olmadığını ve öğrenilen görev eşlemelerini güvenilir şekilde aktaramadığını gösteriyor. Bu keşif, yapay zeka sistemlerinin farklı veri türlerini daha etkili şekilde birleştirmesi için gereken iyileştirmelere ışık tutuyor.
arXiv (CS + AI) · 29 gün önce
0
Yapay Zeka İçin Dev Veri Seti: 90 Bin Fotoğrafla 3D Görsel Üretimi
Araştırmacılar, yapay zekanın gerçekçi 3D görseller üretebilmesi için DF3DV-1K adlı kapsamlı bir veri seti geliştirdi. 1.048 farklı mekan ve toplam 89.924 fotoğraf içeren bu koleksiyon, her sahne için hem temiz hem de karışık görüntüler sunuyor. Tüketici kameralarıyla çekilen fotoğraflar, günlük kullanım koşullarını taklit ediyor ve 128 farklı dikkat dağıtıcı öğe ile 161 mekan teması kapsıyor. Veri seti, yapay zekanın farklı açılardan yeni görüntüler sentezleyebilmesini sağlayan radiance field teknolojilerinin gelişimi için kritik öneme sahip. İç ve dış mekan ortamlarını kapsayan bu kaynak, özellikle karışık ortamlarda bile temiz görüntüler üretebilen sistemlerin test edilmesi amacıyla tasarlandı.
arXiv (CS + AI) · 29 gün önce
0
Gürültülü Web Ortamında Çoklu Kanıt Toplayan Yapay Zeka Test Platformu
Araştırmacılar, yapay zeka sistemlerinin gerçek web ortamındaki karmaşık arama görevlerini ne kadar iyi yerine getirdiğini ölçmek için MERRIN adlı yeni bir test platformu geliştirdi. Bu platform, AI ajanlarının metin, görsel, ses ve video gibi farklı veri türlerini bir araya getirerek çok adımlı mantıksal çıkarımlar yapabilme yeteneklerini değerlendiriyor. Geleneksel test sistemlerinden farklı olarak, belirsiz doğal dil sorguları kullanıyor ve çelişkili bilgilerin bulunduğu gürültülü web ortamlarını simüle ediyor. GPT ve Gemini gibi güçlü kapalı kaynak modellerden açık kaynak alternatiflere kadar on farklı AI modeli üzerinde yapılan testler, mevcut sistemlerin gerçek dünya koşullarındaki sınırlarını ortaya çıkarıyor.
arXiv (CS + AI) · 29 gün önce
0
Büyük Veri Dizilerinde Ortak Kalıpları Bulan Yeni Algoritma Geliştirildi
Araştırmacılar, binlerce karakter içeren uzun veri dizilerinde ortak kalıpları tespit edebilen yenilikçi bir algoritma geliştirdi. MLCS (Çoklu En Uzun Ortak Alt Dizi) madenciliği olarak bilinen bu teknik, genetik, metin analizi ve veri madenciliği alanlarında kritik öneme sahip. Mevcut yöntemler 1000'den fazla karakterlik dizilerle başa çıkamıyordu, bu da büyük veri analizi için ciddi bir engel oluşturuyordu. Yeni KP-MLCS algoritması, 'anahtar nokta' yaklaşımını kullanarak 10 bin karaktere kadar olan büyük dizilerde bile ortak kalıpları başarıyla tespit edebiliyor. Sistem aynı zamanda bulunan kalıpları görsel olarak gösterebilen ve gerçek zamanlı analiz yapabilen çevrimiçi bir araç olarak sunuluyor. Bu gelişme, genomik verilerden sosyal medya analizine kadar pek çok alanda büyük veri işleme kapasitesini önemli ölçüde artıracak.
arXiv (CS + AI) · 29 gün önce
0
Yapay zeka ile tablo anlayan yeni sistem: TableNet veri seti tanıtıldı
Araştırmacılar, büyük dil modellerinin (LLM) tablo yapısını daha iyi anlaması için TableNet adlı yeni bir veri seti geliştirdi. Mevcut veri setlerinin yetersizliği nedeniyle LLM'lerin karmaşık tablo düzenlerini analiz etmede zorlandığı problemi çözmek amacıyla tasarlanan sistem, otonom tablo üretimi ve tanıma teknolojilerini birleştiriyor. Geliştirilen çok-ajan sistem, görsel, yapısal ve semantik parametreleri kontrol edebilen bir yaklaşımla çeşitli tablo görüntüleri oluşturabiliyor. Bu yenilik, yapay zekanın belgelerdeki tabloları daha doğru şekilde yorumlamasını sağlayarak, veri analizi ve belge işleme alanlarında önemli ilerlemeler vaat ediyor. Sistem kullanıcı tanımlı konfigürasyonlarla uyumlu çalışarak, büyük ölçekli veri seti oluşturulmasına imkan tanıyor.
arXiv (CS + AI) · 29 gün önce
0