Yapay zeka alanında tablo yapısı tanıma (TSR) teknolojisi, büyük dil modellerinin (LLM) karmaşık tablo düzenlerini anlayabilmesi için mantıksal akıl yürütme yeteneklerine ihtiyaç duyuyor. Ancak mevcut veri setlerinin sınırlı ölçek ve kalitesi, bu akıl yürütme kapasitesinin etkili kullanımını engelliyor.
Bu problemi çözmek amacıyla araştırmacılar TableNet veri setini geliştirdi. Bu yeni yaklaşım, birden fazla kaynaktan toplanan ve üretilen kapsamlı bir tablo yapısı tanıma veri seti sunuyor. Projenin merkezinde, LLM destekli otonom tablo üretimi ve tanıma teknolojilerini birleştiren çok-ajan sistem yer alıyor.
Sistemin üretim bölümü, tablo görüntülerinin sentezinde kontrol edilebilir görsel, yapısal ve semantik parametreleri entegre ediyor. Bu özellik, semantik olarak tutarlı tabloların geniş bir yelpazede oluşturulmasını sağlıyor ve kullanıcı tanımlı konfigürasyonlara uyum gösterebiliyor.
Geliştirilen teknoloji, büyük ölçekli ve detaylı veri seti oluşturmayı destekleyerek, kapsamlı tablo görüntü açıklama taksonomisi oluşturma imkanı sunuyor. Bu yenilik, yapay zekanın belgelerdeki tabloları daha doğru analiz etmesini sağlayarak, veri işleme ve belge analizi alanlarında önemli ilerlemeler vaat ediyor.