AI Modelleri Ultrason Prosedürlerini Öğrenmeye Başladı

Araştırmacılar, yapay zeka modellerinin ultrason prosedürlerini ne kadar iyi anlayabildiğini test etmek için özel bir veri seti geliştirdi. ReXSonoVQA adlı bu sistem, 514 video klip ve sorulardan oluşuyor. Ultrason çekimi, uzman bir operatörün probe manipülasyonu ve anlık ayarlamalar yapmasını gerektiren karmaşık bir süreç. Görsel-dil modelleri gelecekte otonom ultrason sistemlerini mümkün kılabilir, ancak mevcut değerlendirme sistemleri sadece statik görüntüleri inceliyor, dinamik prosedür anlayışını test etmiyor. Yeni benchmark, üç temel yetkinliği hedefliyor: eylem-hedef muhakemesi, yapay nesne çözünürlüğü ve optimizasyonu, prosedür bağlamı ve planlama. Gemini, Qwen ve LLaVA gibi gelişmiş AI modellerinin testlerinde, modellerin bazı prosedürel bilgileri çıkarabildiği görüldü.

Yapay zeka teknolojisinin tıp alanındaki uygulamaları her geçen gün genişliyor. Son dönemde araştırmacılar, AI modellerinin ultrason prosedürlerini ne ölçüde anlayabildiğini değerlendirmek için kapsamlı bir test sistemi geliştirdi.

ReXSonoVQA adı verilen bu yeni değerlendirme sistemi, 514 video klip ve bunlara eşlik eden 514 sorudan oluşuyor. Sorular çoktan seçmeli ve açık uçlu olmak üzere iki kategoriye ayrılmış durumda. Sistem, AI modellerinin üç kritik alanda yetkinliğini ölçmeyi hedefliyor: eylem-hedef muhakemesi, görüntü kalitesi optimizasyonu ve prosedür planlama yetenekleri.

Ultrason görüntüleme, tıbbi teşhiste yaygın kullanılan bir yöntem olmasına rağmen, başarılı bir ultrason çekimi için operatörün probe'u doğru şekilde manipüle etmesi ve gerçek zamanlı ayarlamalar yapması gerekiyor. Bu durum, otonom ultrason sistemlerinin geliştirilmesini zorlaştırıyor.

Gemini 3 Pro, Qwen3.5-397B, LLaVA-Video-72B ve Seed 2.0 Pro gibi gelişmiş görsel-dil modellerinin test edildiği çalışmada, modellerin bazı prosedürel bilgileri başarıyla çıkarabildiği gözlemlendi. Ancak sorun giderme konularında performansları sınırlı kaldı ve nedensel muhakeme yeteneklerinde eksiklikler tespit edildi.

Bu araştırma, gelecekte ultrason eğitimi, rehberlik sistemleri ve robotik otomasyon alanlarında kullanılabilecek algı sistemlerinin geliştirilmesine katkı sağlayacak.