Yapay zeka alanında görsel arama teknolojilerinde önemli bir adım atıldı. Araştırmacılar, kullanıcıların hem görsel hem de metinsel ipuçlarını birleştirerek aradıkları görseli bulabileceği yenilikçi bir sistem geliştirdi.
HABIT (Chrono-Synergia Robust Progressive Learning Framework) adlı bu sistem, 'Bileşik Görsel Arama' (Composed Image Retrieval - CIR) teknolojisini temel alıyor. Kullanıcılar, bir referans görsel ve bu görselde yapmak istedikleri değişikliği açıklayan metinle birlikte arama yapabiliyor. Örneğin, kırmızı bir ayakkabı görseli gösterip 'mavi olsun' şeklinde bir talep belirtebiliyorlar.
Sistemin en büyük yeniliği, mevcut teknolojilerin karşılaştığı 'Gürültülü Üçlü Veri Sorunu'nu çözmesi. Bu problem, veri etiketleme sürecinin maliyetli ve öznel olmasından kaynaklanıyor. HABIT, karşılıklı bilgi tahmin modülü kullanarak bu sorunu aşıyor ve aşamalı öğrenme yaklaşımıyla sistemin doğruluğunu artırıyor.
Teknoloji, özellikle kişiselleştirilmiş arama motorları, e-ticaret platformları ve sosyal medya uygulamalarında devrim yaratma potansiyeline sahip. Kullanıcıların görsel tercihlerini daha hassas şekilde anlayan sistem, dijital arama deneyimini köklü şekilde değiştirebilir.