Büyük dil modellerinin bilgi gerektiren görevlerdeki başarısını artıran Retrieval-Augmented Generation (RAG) teknolojisinde çığır açan bir gelişme yaşandı. Mevcut RAG sistemlerinin temel bir sorunu, topladıkları bilgi parçalarını düz ve yapısız şekilde işlemesiydi. Bu durum, modellerin metinler arası yapısal ipuçlarını yakalayamamasına ve farklı dokümanlardan gelen bilgileri etkili şekilde birleştirememesine neden oluyordu.
Araştırmacılar bu sınırlamaları aşmak için Disco-RAG adlı yenilikçi bir çerçeve geliştirdi. Bu sistem, söylem sinyallerini üretim sürecine açık şekilde entegre ediyor. Disco-RAG'in ayırt edici özelliği, bilgi parçaları içindeki yerel hiyerarşileri yakalamak için söylem ağaçları oluşturması ve metinler arası tutarlılığı modellemek için retorik grafikler kurmasıdır.
Sistemin çalışma prensibi, bu yapısal elementleri bir planlama şablonunda birleştirerek üretim sürecini yönlendirmesi üzerine kurulu. Bu yaklaşım, yapay zekanın sadece bilgi toplamakla kalmayıp, bu bilgileri mantıklı ve tutarlı şekilde organize etmesini sağlıyor.
Soru cevaplama ve uzun doküman özetleme alanlarında yapılan kapsamlı testlerde, Disco-RAG'in mevcut en gelişmiş yöntemleri geride bıraktığı görüldü. Bu başarı, sistemin farklı kaynaklardan gelen bilgileri daha etkili şekilde sentezleyebilme kabiliyetinden kaynaklanıyor.