Yapay Zeka Artık Görsel İlişkileri Daha İyi Anlıyor

30 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (Dilbilim & NLP)

Paylaş: Kopyalandı!

Araştırmacılar, çok modlu yapay zeka modellerinin görsel ve metinsel bilgileri birlikte işleyerek karmaşık ilişkisel yapıları anlama yeteneğini geliştiren yeni bir yaklaşım ortaya koydu. STAR (Yapılandırılmış ve Soyut Muhakeme) adı verilen bu yöntem, görsel verilerden çıkarılan soyut ilişkileri düğüm-kenar formatında modelleyerek AI'nın muhakeme kapasitesini artırıyor. Çalışma, özellikle görsel modallıktan gelen soyut bilgilerin işlenmesindeki zorlukları ele alıyor ve bu alanda önemli bir boşluğu dolduruyor. Geliştirilen otomatik veri motoru, çok modlu talimat verilerini güvenilir düşünce zinciri mantığıyla sentezleyebiliyor.

Yapay zeka alanında çok modlu büyük dil modelleri (MLLM'ler) her geçen gün daha karmaşık görevleri üstlenebilir hale geliyor. Ancak görsel modaliteden gelen soyut bilgilerin anlaşılması ve bu bilgiler üzerinde muhakeme yapılması hâlâ önemli zorluklar barındırıyor.

Yeni araştırma, Çok Modlu İlişkisel Bilgi (MMRK) olarak adlandırılan ve çok modlu varlıklar arasındaki soyut ilişkisel yapıları düğüm-kenar formatlarıyla temsil eden bir yaklaşımı inceliyor. Bu tür verilere yönelik Yapılandırılmış ve Soyut Muhakeme (STAR) yeteneği, araştırma topluluğundan şimdiye kadar yeterli ilgiyi görmemiş durumda.

Araştırmacılar, bu alandaki büyük ölçekli yüksek kaliteli veri eksikliği ve yetenek geliştirme metodolojilerindeki boşlukları kapatmak için iki önemli katkı sunuyor. İlki, MMRK içeren görüntüleri sentezleyebilen ve çeşitli STAR görevleri için güvenilir düşünce zinciri mantığıyla çok modlu talimat verileri oluşturabilen otomatik bir veri motoru.

İkincisi ise kapsamlı iki aşamalı bir yetenek geliştirme eğitim çerçevesi. Bu yaklaşım, yapay zekanın görsel verilerden çıkardığı soyut ilişkileri daha iyi anlamasını ve bu bilgiler üzerinde daha etkili muhakeme yapabilmesini sağlıyor.

Yapay Zeka Artık Görsel İlişkileri Daha İyi Anlıyor

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Cinsel Travma Yaşayan Kişilerde Dinsel Saflık Kültürünün Psikolojik Etkileri

Yapay zeka Turing testinde insanlardan daha 'insani' görünüyor

Yapay zeka görselleri insanlar gibi algılamıyor: Doku tanımada büyük fark keşfedildi