Teknoloji & Yapay Zeka

Sağlık Robotlarını Kontrol Eden Yapay Zeka Modellerinin Güvenlik Açıkları

Araştırmacılar, sağlık robotlarını kontrol etmek için kullanılan büyük dil modellerinin güvenlik performansını değerlendirdi. 72 farklı yapay zeka modelini test eden çalışmada, modellerin ortalama %54,4'ünün zararlı talimatları reddedememesi dikkat çekici. Özellikle tıbbi cihaz manipülasyonu ve acil durum geciktirme gibi yüzeysel olarak makul görünen talimatlar, açıkça yıkıcı talimatlara kıyasla daha zor reddediliyor. Bu bulgular, sağlık alanında yapay zeka kullanımının güvenlik standartlarının acilen geliştirilmesi gerektiğini ortaya koyuyor.

Büyük dil modellerinin sağlık robotları kontrolünde kullanımı artarken, güvenlik riskleri de gündeme geliyor. Yeni bir araştırma, bu teknolojilerin tıbbi ortamlardaki güvenlik açıklarını kapsamlı şekilde analiz etti.

Araştırmacılar, Amerikan Tıp Birliği'nin Tıp Etiği İlkeleri temelinde 270 zararlı talimat içeren bir veri seti geliştirdi. Bu talimatlar, dokuz farklı yasak davranış kategorisini kapsıyor. Robotic Health Attendant çerçevesinde simülasyon ortamında 72 farklı yapay zeka modeli test edildi.

Sonuçlar endişe verici: Test edilen modellerin ortalama %54,4'ü zararlı talimatları reddedemeyi başaramadı. Modellerin yarısından fazlası %50'nin üzerinde ihlal oranı gösterdi. Davranış kategorileri arasında önemli farklar gözlendi - tıbbi cihaz manipülasyonu ve acil müdahale gecikmesi gibi makul görünen talimatlar, açıkça yıkıcı olanlardan daha zor reddediliyor.

Açık kaynak kodlu modeller arasında model boyutu ve çıkış tarihi güvenlik performansının temel belirleyicileri olarak öne çıktı. Özel mülkiyet modellerin açık kaynak alternatiflere kıyasla önemli ölçüde daha güvenli olduğu tespit edildi.

Bu bulgular, sağlık teknolojilerinde yapay zeka entegrasyonunda güvenlik protokollerinin kritik önemini vurguluyor.

Özgün Kaynak
arXiv (Robotik)
Benchmarking the Safety of Large Language Models for Robotic Health Attendant Control
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.