Kimyasal reaksiyon veri tabanları, modern kimya araştırmalarının temel taşlarından biridir. Ancak USPTO gibi yaygın kullanılan veri tabanları önemli bir sorunla karşı karşıya: eksik veriler. Bu veri tabanlarında sıklıkla yan ürünler, yardımcı reaktifler ve stokiyometrik katsayılar eksik kalıyor, bu da güvenilirlik sorunlarına yol açıyor.
Araştırmacılar bu soruna çözüm bulmak için CompleteRXN adlı kapsamlı bir sistem geliştirdi. Bu sistem, gerçekçi eksik veri koşulları altında reaksiyon tamamlama için büyük ölçekli denetimli bir test ortamı sunuyor. Çalışmada, USPTO kayıtları özenle seçilmiş mekanistik reaksiyonlarla eşleştirilerek, eksik ve atom dengeli reaksiyonlardan oluşan bir veri seti oluşturuldu.
Geliştirilen Constrained Reaction Balancer (CRB) modeli, özel bir kodlayıcı-kod çözücü mimarisi kullanıyor ve kısıtlı kod çözme tekniğiyle destekleniyor. Bu model, artan zorluk seviyelerindeki test setlerinde etkileyici performans gösterdi. Rastgele bölünmüş veri setinde %99.20 eşdeğerlik doğruluğuna ulaşırken, en zorlu dağılım dışı test koşullarında bile %91.12 doğruluk elde etti.
Bu başarı, kimyasal reaksiyon tahmininde önemli bir ilerleme anlamına geliyor. İlaç keşfi, kimyasal sentez planlaması ve reaksiyon optimizasyonu gibi alanlarda daha güvenilir sonuçlar elde edilmesi mümkün hale geliyor.