Yapay zeka destekli kişi tanıma sistemlerinde devrim niteliğinde bir gelişme yaşanıyor. Araştırmacılar, metin tabanlı kişi tanıma (TBPR) alanında tamamen sentetik veri kullanmanın mümkün olup olmadığını araştıran kapsamlı bir çalışma yürüttü.
Geleneksel metin tabanlı kişi tanıma sistemleri, gerçek kişi fotoğrafları ve bunlara ait manuel olarak hazırlanmış metin açıklamalarına dayanıyor. Bu yaklaşım ciddi mahremiyet sorunları ve yüksek açıklama maliyetleri doğuruyor. Mevcut sentetik veri üretim çabaları bile hâlâ gerçek verileri temel alarak çalışıyor ve aynı sınırlamaları miras alıyor.
Bu çalışmada araştırmacılar, gerçek kişi verilerine hiç ihtiyaç duymayan birleşik bir veri sentezi pipeline'ı geliştirdi. Sistem, otomatik prompt oluşturma stratejileri kullanarak çeşitli kimlik merkezli görüntüler üretebilen sınıflar arası görüntü üretim modülü içeriyor.
Araştırma iki ana bileşeni içeriyor: tamamen sentetik veri ile çalışabilen veri üretim sistemi ve sentetik verinin çeşitli gerçek dünya senaryolarındaki etkinlik sınırlarını değerlendiren sistematik analiz. Bu çalışma, TBPR alanında tamamen sentetik veri kullanımının ilk kapsamlı deneysel incelemesi olma özelliği taşıyor.