Yapay Zeka İlaç Güvenliği Araştırmalarında Uzman Danışman Olabilir mi?

Araştırmacılar, büyük dil modellerinin farmakoepidemiiyolojik çalışma tasarımında ne kadar güvenilir olduğunu test etti. GPT-4o ve DeepSeek-R1 gibi genel amaçlı yapay zeka sistemleri, özel olarak tıp alanında eğitilmiş modellere kıyasla daha başarılı sonuçlar verdi. Çalışma, 2018-2024 yılları arasındaki 46 protokol üzerinde gerçekleştirildi ve ileri düzey yönlendirme teknikleri kullanıldı. Sonuçlar, yapay zekanın ilaç güvenliği araştırmalarının planlanmasında destek sağlayabileceğini ancak henüz tam güvenilir olmadığını gösteriyor.

Büyük dil modelleri ilaç güvenliği araştırmalarının tasarımında ne kadar yararlı olabilir? Bu soruya yanıt arayan bir araştırma, yapay zeka sistemlerinin farmakoepidemiiyoloji alanındaki potansiyelini değerlendirdi.

Araştırmacılar, genel amaçlı yapay zeka modelleri ile özellikle tıp alanında eğitilmiş modelleri karşılaştırdı. GPT-4o ve DeepSeek-R1 gibi genel amaçlı sistemler, Bio-Medical-Llama ve tıbbi soru-cevap verileriyle eğitilmiş Qwen2 gibi özelleşmiş modellere karşı test edildi.

Test için 2018-2024 yılları arasında HMA-EMA Kataloğu ve Sentinel Sistemi'nden 46 protokol kullanıldı. Araştırmacılar, modellerin performansını uygunluk, mantıksal gerekçelendirme ve ontoloji kod eşleşmesi açısından değerlendirdi. Özellikle 'Least-to-Most' ve 'Aktif Yönlendirme' gibi gelişmiş teknikler denendi.

Sonuçlar şaşırtıcıydı: GPT-4o ve DeepSeek-R1, özel tıp eğitimi almış modelleri geride bıraktı. Bu sistemler, doğru yönlendirme teknikleriyle birleştirildiğinde en yüksek uygunluk ve mantıksal gerekçelendirme puanlarını elde etti.

Bu bulgular, yapay zekanın ilaç güvenliği araştırmalarının planlanmasında destek sağlayabileceğini gösterse de, araştırmacılar bu teknolojinin güvenilirliğinin henüz tam olarak karakterize edilmediği konusunda uyarıyor.