T hücresi reseptörlerinin (TCR) peptid-MHC (pMHC) molekül bağlanmalarını doğru tahmin etmek, modern tıbbın en önemli zorluklarından biri. Bu bağlanma sürecinin anlaşılması, etkili aşıların tasarlanması ve T hücresi temelli tedavilerin geliştirilmesi için kritik önem taşıyor.
Mevcut modellerin en büyük problemi, eğitim sırasında karşılaşmadıkları epitoplarla karşılaştıklarında aşırı güvenli davranmaları. Bu durum, sessiz yanlış tahminlere yol açıyor ve tıbbi önceliklendirmede güvenilirlik sorunları yaratıyor.
Araştırmacılar bu sorunu 'seçici tahmin' yaklaşımıyla çözmeye odaklandı. Bu yöntemde, kalibre edilmiş model ya güvenilir bir güven skoru üretir ya da açıkça karar vermekten kaçınır. Sistem üç temel bileşenden oluşuyor: CDR3α/CDR3β ve peptid dizilerini kodlayan dual-encoder mimarisi, sistematik olasılık yanlış kalibrasyonunu düzelten sıcaklık ölçeklendirmesi ve kullanıcının belirlediği hata oranında finite-sample kapsama garantisi sağlayan conformal abstention kuralı.
Model, önceden eğitilmiş protein dil modeli kullanarak geliştirildi. Üç farklı bölme stratejisi altında test edildi: rastgele, epitop-dışlanmış ve mesafe-farkındalı yaklaşımlar. Sonuçlar, zorlu test koşulları altında bile AUROC 0.813 ve ECE 0.043 gibi güçlü performans metrikleri gösterdi.