“görü-dil modeli” için sonuçlar
3 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
Küçük Veri ile Büyük Başarı: Kompakt Yapay Zeka Modelleri Geliştiren Yeni Yaklaşım
Araştırmacılar, çocukların dil öğrenme sürecinden ilham alarak, sınırlı kaynaklarla çalışabilen kompakt görü-dil modelleri geliştirdi. ESsEN adlı bu yeni yaklaşım, milyarlarca parametre gerektiren büyük modellere alternatif sunuyor. İki-kule encoder mimarisi ve geleneksel konvolüsyonel ağların transformer yapılarıyla entegrasyonu sayesinde, küçük veri setleriyle eğitilen modeller bile başarılı sonuçlar veriyor. Bu gelişme, özellikle mobil cihazlar ve özerk robotik sistemler için kritik önem taşıyor. Çalışma, yapay zekanın daha erişilebilir hale gelmesi yolunda önemli bir adım olarak değerlendiriliyor.
Yapay zeka artık video izleyip beceri seviyenizi değerlendirebiliyor
Araştırmacılar, çok açılı video kayıtlarını analiz ederek kişilerin beceri seviyelerini değerlendiren yeni bir yapay zeka modeli geliştirdi. ProfVLM adlı bu sistem, geleneksel yaklaşımların aksine sadece puan vermekle kalmıyor, aynı zamanda uzman görüşü niteliğinde doğal dilde geri bildirimler de üretiyor. Model, hem birinci şahıs hem de üçüncü şahıs kamera açılarından çekilen videoları eş zamanlı olarak işleyerek, kişinin performansını değerlendiriyor ve gelişim önerileri sunuyor. Bu teknoloji, eğitim, spor antrenörlüğü ve mesleki gelişim alanlarında devrim yaratma potansiyeline sahip.
SpatialStack: Yapay Zeka İçin Yeni 3D Mekan Anlama Teknolojisi
Araştırmacılar, yapay zekanın 3D uzaysal ilişkileri anlama yetisini geliştiren SpatialStack adlı yeni bir sistem geliştirdi. Mevcut görü-dil modelleri, fiziksel dünyada faaliyet gösteren AI sistemleri için kritik olan 3D mekansal mantık yürütmede yetersiz kalıyor. Bu sorun, modellerin ince taneli 3D geometriyi ve uzaysal ilişkileri yakalayamamasından kaynaklanıyor. SpatialStack, görsel, geometrik ve dil temsillerini model hiyerarşisi boyunca aşamalı olarak hizalayan hiyerarşik bir füzyon çerçevesi sunuyor. Geleneksel geç aşama görü-geometri birleşiminin ötesine geçen bu yaklaşım, çok seviyeli geometrik özellikleri dil omurgasıyla senkronize ederek hem yerel geometrik hassasiyet hem de küresel bağlamsal semantiği yakalama imkanı sağlıyor.