Büyük dil modelleri ilaç güvenliği araştırmalarının tasarımında ne kadar yararlı olabilir? Bu soruya yanıt arayan bir araştırma, yapay zeka sistemlerinin farmakoepidemiiyoloji alanındaki potansiyelini değerlendirdi.
Araştırmacılar, genel amaçlı yapay zeka modelleri ile özellikle tıp alanında eğitilmiş modelleri karşılaştırdı. GPT-4o ve DeepSeek-R1 gibi genel amaçlı sistemler, Bio-Medical-Llama ve tıbbi soru-cevap verileriyle eğitilmiş Qwen2 gibi özelleşmiş modellere karşı test edildi.
Test için 2018-2024 yılları arasında HMA-EMA Kataloğu ve Sentinel Sistemi'nden 46 protokol kullanıldı. Araştırmacılar, modellerin performansını uygunluk, mantıksal gerekçelendirme ve ontoloji kod eşleşmesi açısından değerlendirdi. Özellikle 'Least-to-Most' ve 'Aktif Yönlendirme' gibi gelişmiş teknikler denendi.
Sonuçlar şaşırtıcıydı: GPT-4o ve DeepSeek-R1, özel tıp eğitimi almış modelleri geride bıraktı. Bu sistemler, doğru yönlendirme teknikleriyle birleştirildiğinde en yüksek uygunluk ve mantıksal gerekçelendirme puanlarını elde etti.
Bu bulgular, yapay zekanın ilaç güvenliği araştırmalarının planlanmasında destek sağlayabileceğini gösterse de, araştırmacılar bu teknolojinin güvenilirliğinin henüz tam olarak karakterize edilmediği konusunda uyarıyor.