Yapay zeka teknolojilerinin tıp alanındaki kullanımı giderek yaygınlaşırken, bu sistemlerin gerçek hastane koşullarındaki performansları merak konusu olmaya devam ediyor. Güney Afrika'da gerçekleştirilen yeni bir araştırma, bu soruya kapsamlı yanıtlar sunuyor.
VALID adı verilen bu retrospektif çalışmada, Güney Afrika'daki üçüncü basamak bir devlet hastanesinden 539 gerçek hasta vakası analiz edildi. Araştırmacılar, 10 farklı multimodal büyük dil modelinin (LLM) tanı koyma yeteneklerini test etti. Bu modeller, BT, MR ve göğüs röntgeni gibi radyolojik görüntüler, laboratuvar sonuçları, klinik notlar ve vital bulgular dahil olmak üzere çok çeşitli tıbbi verileri değerlendirdi.
Çalışmanın metodolojisi oldukça titizdi. Uzman doktor panelleri 300 vakanın doğru tanılarını, diferansiyel tanı listelerini ve tıbbi gerekçelerini belirledi. Yapay zeka modelleri bu vakalar üzerinde 'sıfır atış' yöntemiyle, yani önceden eğitilmeden çalışarak tanı koymaya çalıştı. Sonrasında özel olarak kalibre edilmiş üç model içeren bir jüri sistemi, tüm çıktıları tanı doğruluğu, diferansiyel tanı kalitesi, mantıklı gerekçelendirme ve hasta güvenliği açısından değerlendirdi.
Bu araştırma, özellikle gelişmekte olan ülkelerdeki sağlık sistemleri için yapay zeka destekli tanı araçlarının potansiyelini ortaya koyması açısından büyük önem taşıyor. Sonuçlar, yapay zekanın tıbbi tanıda nasıl bir rol oynayabileceği konusunda önemli ipuçları veriyor.