Tıp & Sağlık

Göğüs BT Taramalarında Yapay Zeka Performansı Yanıltıcı Çıktı

Yapay zeka sistemlerinin göğüs tomografisi görüntülerini analiz etme başarısı, gerçekte olduğundan çok daha yüksek görünüyor. Araştırmacılar, mevcut test yöntemlerinin ciddi bir hata içerdiğini keşfetti. Eğitim ve test verilerinde aynı hastalardan alınan görüntülerin karışması, yapay zekanın performansını olduğundan 3 kat daha iyi gösteriyor. Yeni geliştirilen CTSCAN kıyaslama sistemi bu sorunu çözmeyi hedefliyor. Doğru test yöntemleri uygulandığında, yapay zeka sistemlerinin başarı oranı %66'dan %20'ye düşüyor. Bu bulgular, tıp alanında yapay zeka sistemlerinin güvenilirliği konusunda önemli sorular ortaya çıkarıyor ve daha titiz test protokollerine ihtiyaç olduğunu gösteriyor.

Yapay zeka destekli tıbbi görüntüleme sistemlerinin performansı, önceden düşünüldüğünden çok daha düşük olabilir. Yeni bir araştırma, göğüs tomografisi analizinde kullanılan yapay zeka modellerinin test edilme biçiminde kritik bir hata bulunduğunu ortaya koydu.

Araştırmacılar, mevcut test yöntemlerinin aynı hastadan alınan farklı görüntü kesitlerini hem eğitim hem de test verilerinde kullandığını tespit etti. Bu durum, yapay zekanın gerçek performansından çok daha başarılı görünmesine neden oluyor.

CTSCAN adı verilen yeni kıyaslama sistemi geliştirildi. Bu sistem, PleThora, MedSeg SIRM ve LongCIU gibi farklı kaynaklardan toplam 89 vaka üzerinde çalışıyor. Geleneksel yöntemle test edilen yapay zeka sistemi %66 başarı oranına ulaşırken, hasta verilerinin karıştırılmadığı doğru test yönteminde bu oran sadece %20'ye düşüyor.

Bu dramatik fark, yapay zekanın aslında hastalık tanısı yerine hasta tanısı yaptığını gösteriyor. Sistem, aynı hastanın farklı görüntülerini tanımayı öğreniyor, ancak yeni hastalar karşısında zorlanıyor.

Bulgular, tıp alanında yapay zeka sistemlerinin klinik kullanıma geçmeden önce çok daha titiz testlerden geçmesi gerektiğini ortaya koyuyor. Hasta güvenliği açısından kritik olan bu konu, gelecekteki araştırmaların yöntemsel standartlarını yeniden gözden geçirmesini gerektiriyor.

Özgün Kaynak
arXiv (CS + AI)
CTSCAN: Evaluation Leakage in Chest CT Segmentation and a Reproducible Patient-Disjoint Benchmark
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.