Araştırmacılar, yapay zeka modellerinin birden fazla grafik üzerinde akıl yürütme yeteneğini test eden InterChart adlı yeni bir değerlendirme sistemi geliştirdi. Bu test, bilimsel raporlama, finansal analiz ve kamu politikası panolarında kritik olan çoklu grafik analizi becerisini ölçüyor. Mevcut en gelişmiş görsel-dil modellerinin bu konuda ciddi eksiklikleri olduğu ortaya çıktı. Test üç zorluk seviyesinden oluşuyor: tekil grafik analizi, birbirleriyle ilişkili grafik setlerinde bütünleştirici analiz ve gerçek dünya grafik çiftlerinde semantik çıkarım. Sonuçlar, grafik karmaşıklığı arttıkça AI modellerinin başarısının dramatik şekilde düştüğünü gösteriyor. Bu bulgular, AI sistemlerinin gerçek dünya uygulamalarında daha etkili olabilmesi için görsel akıl yürütme yeteneklerinin geliştirilmesi gerektiğini ortaya koyuyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Artık Görsel Bulmacaları İnsanlar Gibi Çözebiliyor

Araştırmacılar, görsel mantık yürütme problemlerini çözen yeni bir yapay zeka modeli geliştirdi. DIRCR adı verilen sistem, hem yerel hem küresel görsel ipuçlarını birleştirerek, karmaşık görsel bulmacaları daha etkili çözebiliyor. Model, satır bazında analojik akıl yürütme ile bütünsel çıkarımı harmanlayan ikili bir yaklaşım kullanıyor. Özellikle RAVEN veri setlerinde test edilen sistem, mevcut yöntemlere göre çok daha güçlü performans sergiledi. Bu gelişme, yapay zekanın soyut düşünme ve örüntü tanıma yeteneklerinde önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri Yüksek Çözünürlüklü Görüntüleri Daha Akıllıca İşliyor

Araştırmacılar, büyük çoklu modal AI modellerinin yüksek çözünürlüklü görüntülerde karşılaştığı verimsizlik sorununu çözmek için yeni bir yöntem geliştirdi. MGPO adlı bu sistem, modellerin görüntünün tamamını işlemek yerine önemli bölgelere odaklanmasını sağlıyor. Takviyeli öğrenme tekniği kullanan yöntem, modelin kendi kendine görüntüde hangi alanların kritik olduğunu öğrenmesini ve bu bölgeleri otomatik olarak kırparak analiz etmesini mümkün kılıyor. Bu yaklaşım, pahalı ek etiketleme gerektiren geleneksel yöntemlere alternatif sunuyor ve modellerin sadece doğru cevap verip vermediğine bakarak öğrenmesini sağlıyor. Geliştirilen sistem, görsel akıl yürütme görevlerinde daha etkili performans gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

OVOD-Agent: Görsel Akıl Yürütme ile Kendini Geliştiren Yapay Zeka Detektörü

Araştırmacılar, görsel nesneleri tespit eden yapay zeka sistemlerinin performansını artıran yeni bir yaklaşım geliştirdi. OVOD-Agent adı verilen bu sistem, geleneksel sabit kategori eşleştirmesi yerine proaktif görsel akıl yürütme kullanıyor. Chain-of-Thought paradigmasından ilham alan sistem, görsel bağlamı anlamak için Markov karar süreçleri kullanıyor ve zamanla kendini geliştiriyor. Bu yenilik, yapay zekanın görsel nesneleri tanıma ve sınıflandırma yeteneklerinde önemli bir ilerleme sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Modelleri Görsel-Uzamsal Mantıkta Beklenmedik Zorlanıyor

Matematiksel problemleri çözmede çığır açan Chain-of-Thought (CoT) yöntemi, çok modlu yapay zeka modellerinde beklenmedik bir zayıflık ortaya çıkardı. Araştırmacılar, 17 farklı AI modelini 13 uzamsal akıl yürütme testinde değerlendirdiğinde, CoT yönteminin görsel-uzamsal problemlerde performansı düşürdüğünü keşfetti. Daha da şaşırtıcı olan bulgu, bu modellerin hiç görsel veri olmadığında bile metin ipuçlarından yola çıkarak görsel detaylar 'hayal etmesi' oldu. Bu durum, mevcut AI sistemlerinin görsel ve metin bilgilerini entegre etmede ciddi kısayollar kullandığını gösteriyor. Bulgular, uzamsal zeka gerektiren görevler için tamamen yeni, görsel odaklı akıl yürütme yaklaşımlarına ihtiyaç olduğuna işaret ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Video Anlama Yetisinde Yeni Test: Uzamsal-Zamansal Akıl Yürütme

Araştırmacılar, çok modlu büyük dil modellerinin video içeriklerini ne kadar iyi anlayabildiğini test etmek için yeni bir değerlendirme sistemi geliştirdi. VAEX-BENCH adlı bu sistem, yapay zekanın sadece videolarda gördüklerini tanımlamasını değil, farklı zamanlardaki olayları birleştirerek soyut çıkarımlar yapabilme becerisini ölçüyor. Mevcut testler genellikle videoda açıkça görülen bilgileri tespit etmeye odaklanırken, bu yeni yaklaşım yapay zekanın gerçek dünya senaryolarında daha karmaşık görsel akıl yürütme yapabilme kapasitesini değerlendiriyor. Sistem, nesne seviyesinden oda planlamasına kadar farklı karmaşıklık düzeylerinde senaryolar sunarak, yapay zekanın uzamsal ve zamansal bilgileri entegre etme yeteneğini test ediyor.

arXiv (CS + AI) 0