Yapay zeka destekli web otomasyonu alanında önemli bir adım atıldı. Büyük dil modelleri kullanarak çalışan otonom web ajanları, karmaşık tarayıcı görevlerini yerine getirme konusunda gelişme gösterse de, uzun süreli ve çok aşamalı iş akışlarında hala ciddi zorluklar yaşıyor.

Araştırmacıların geliştirdiği WebXSkill sistemi, bu alandaki temel bir sorunu çözmek için tasarlandı. Mevcut sistemlerde iki tür beceri formülasyonu bulunuyor: metin tabanlı iş akışı becerileri doğal dil rehberliği sağlıyor ancak doğrudan çalıştırılamıyor; kod tabanlı beceriler ise çalıştırılabilir olmasına rağmen ajan için opak kalıyor ve hata kurtarma ya da adaptasyon için gerekli adım düzeyinde anlayış sunmuyor.

WebXSkill framework'ü bu sorunu 'yürütülebilir beceriler' konseptiyle çözüyor. Bu beceriler, parametreli eylem programlarını adım adım doğal dil rehberliğiyle birleştirerek hem doğrudan çalıştırma hem de ajan odaklı adaptasyon imkanı sunuyor.

Sistem üç aşamada çalışıyor: İlk olarak beceri çıkarımı aşamasında, mevcut sentetik ajan yörüngelerinden yeniden kullanılabilir eylem alt dizileri çıkarılıyor ve bunlar parametreli becerilere dönüştürülüyor. İkinci aşamada beceri organizasyonu, bu becerileri URL tabanlı bir grafik yapısında indeksliyor. Bu yaklaşım, web ajanlarının daha etkili öğrenme ve adaptasyon yetenekleri kazanmasını sağlıyor.