Yapay zeka araştırmacıları, gerçek dünya belgelerindeki karmaşık tabloları okuyup anlayabilen sistemler geliştirmek için yeni bir veri seti hazırladılar. Özellikle diş hekimliği faturalarına odaklanan bu çalışma, praktik uygulamalarda karşılaşılan zorluklara çözüm arıyor.
DenTab olarak adlandırılan veri seti, 2.000 diş tedavi faturasından alınmış tablo görüntülerini içeriyor. Bu tablolar, gerçek ofis ortamlarında taranmış belgelerden elde edildiği için gürültü, çarpıklık ve kalite sorunları gibi pratik zorlukları yansıtıyor. Her tablo için detaylı HTML açıklamaları hazırlanarak, satır-sütun yapısı, birleştirilmiş hücreler ve başlık bilgileri gibi yapısal elementler işaretlenmiş.
Veri seti ayrıca 2.208 soruyu da barındırıyor. Bu sorular on bir farklı kategoride düzenlenmiş ve bilgi çıkarma, toplama işlemleri ile mantık kontrollerini kapsıyor. Örneğin sistem, 'Bu tedavinin toplam maliyeti nedir?' gibi basit sorulardan 'Fatura tutarları tutarlı mı?' gibi karmaşık analizlere kadar çeşitli görevleri yerine getirebiliyor.
Araştırmacılar, 16 farklı sistemi test ettiler ve bunların 14'ü modern görsel-dil modelleri içeriyordu. Bu çalışma, sağlık sektöründe evrak otomasyonu alanında önemli bir adım teşkil ediyor ve gelecekte diğer sektörlere de uyarlanabilir.