Yapay zeka destekli tıbbi görüntüleme sistemlerinin performansı, önceden düşünüldüğünden çok daha düşük olabilir. Yeni bir araştırma, göğüs tomografisi analizinde kullanılan yapay zeka modellerinin test edilme biçiminde kritik bir hata bulunduğunu ortaya koydu.
Araştırmacılar, mevcut test yöntemlerinin aynı hastadan alınan farklı görüntü kesitlerini hem eğitim hem de test verilerinde kullandığını tespit etti. Bu durum, yapay zekanın gerçek performansından çok daha başarılı görünmesine neden oluyor.
CTSCAN adı verilen yeni kıyaslama sistemi geliştirildi. Bu sistem, PleThora, MedSeg SIRM ve LongCIU gibi farklı kaynaklardan toplam 89 vaka üzerinde çalışıyor. Geleneksel yöntemle test edilen yapay zeka sistemi %66 başarı oranına ulaşırken, hasta verilerinin karıştırılmadığı doğru test yönteminde bu oran sadece %20'ye düşüyor.
Bu dramatik fark, yapay zekanın aslında hastalık tanısı yerine hasta tanısı yaptığını gösteriyor. Sistem, aynı hastanın farklı görüntülerini tanımayı öğreniyor, ancak yeni hastalar karşısında zorlanıyor.
Bulgular, tıp alanında yapay zeka sistemlerinin klinik kullanıma geçmeden önce çok daha titiz testlerden geçmesi gerektiğini ortaya koyuyor. Hasta güvenliği açısından kritik olan bu konu, gelecekteki araştırmaların yöntemsel standartlarını yeniden gözden geçirmesini gerektiriyor.