Bilim iletişimi araştırmalarında önemli bir adım atılarak, Google Haberler platformundan sistematik haber veri setleri oluşturmak için yenilikçi bir metodoloji geliştirildi. Bu yaklaşım, otomatik web kazıma teknikleri, büyük dil modelleri ve SCImago Medya Sıralamaları zenginleştirmesi kombinasyonunu kullanıyor.

IFMIF-DONES füzyon enerji projesi üzerinden test edilen sistem, beş aşamalı bir veri toplama süreci izliyor. 81 farklı bölge-dil kombinasyonunda çalışan bu sistem, başlangıçta toplanan verileri %56 oranında temizleyerek 1.482 geçerli kayıt elde etti.

Araştırmanın en çarpıcı bulgularından biri, farklı haber kaynaklarının örtüşme analizi sonuçları oldu. Google Haberler üzerinden elde edilen kayıtların %76'sının MyNews ve ProQuest Newsstream Collection gibi ticari veri tabanlarında bulunmadığı ortaya çıktı. Bu durum, farklı platformların birbirini tamamlayıcı nitelikte olduğunu gösteriyor.

Geliştirilen sistem, ticari veri tabanlarında genellikle yer almayan özel yayınlar, kurumsal iletişim materyalleri ve sosyal medya içeriklerini yakalama konusunda öne çıkıyor. Ancak araştırmacılar, temporal kararsızlık ve senkron veri toplama gerekliliği gibi metodolojik zorluklara da dikkat çekiyor.