Yapay zekanın sağlık sektöründe yaygın kabul görmesi için güvenilirlik ve şeffaflık vazgeçilmez unsurlar olarak öne çıkıyor. Son dönemde geliştirilen derin araştırma sistemleri, AI ajanlarını çok aşamalı bilgi erişimi, mantıksal çıkarım ve sentez süreçleriyle birleştirerek kanıt temelli bilimsel keşifleri hızlandırmayı hedefliyor.
Ancak mevcut sistemlerin çoğunda kanıt değerlendirmesi için açık ve denetlenebilir kriterlerin eksikliği dikkat çekiyor. Bu durum, hataların birikmesi riskini artırırken, araştırmacı ve klinisyenlerin sistem çıktılarının güvenilirliğini değerlendirmesini zorlaştırıyor. Ayrıca güncel performans değerlendirme yaklaşımları, karmaşık gerçek dünya tıbbi sorularını nadiren test ediyor.
Bu sorunlara çözüm getirmek amacıyla araştırmacılar DeepER-Med adlı yeni bir framework geliştirdi. Bu sistem, tıbbi araştırmaları açık ve denetlenebilir bir kanıt temelli üretim iş akışı olarak çerçeveliyor. Sistem üç temel modülden oluşuyor: araştırma planlama, işbirlikçi AI ajanları ve sentez süreci.
DeepER-Med'in en önemli özelliği, kanıt değerlendirmesi için şeffaf kriterlere sahip olması. Bu yaklaşım, sistemin çıktılarının nasıl elde edildiğini anlaşılır kılarak, tıbbi araştırmalarda AI kullanımında güven oluşturmayı hedefliyor.