Yapay zeka dünyasında büyük dil modellerinin başarısı, onları daha küçük ve pratik modellere dönüştürme ihtiyacını doğurdu. Bu süreçte kullanılan 'bilgi damıtma' tekniği, büyük öğretmen modellerden küçük öğrenci modellere bilgi aktarımını sağlıyor.

Geleneksel yöntemlerde karşılaşılan temel sorun, eğitim ve gerçek kullanım arasındaki dağılım uyumsuzluğu. Mevcut on-policy yaklaşımlar bu sorunu çözmeye çalışsa da, acemi öğrenci ile uzman öğretmen arasındaki büyük fark nedeniyle eğitim kararsızlıkları yaşanıyor.

Araştırmacıların geliştirdiği Veto sistemi, logit uzayında geometrik bir köprü kurarak bu soruna çözüm getiriyor. Sistem, veri örneklerini karıştırmak yerine, öğretmen ve öğrenci modeller arasında uyumu artıracak ara hedef dağılımlar yaratıyor.

Bu yenilikçi yaklaşım, forward KL hedeflerindeki patolojik gradyanları ve reverse KL rejimlerindeki çeşitlilik çöküşünü önlemeyi hedefliyor. Böylece daha kararlı ve etkili bir bilgi aktarım süreci sağlanıyor.

Veto'nun getirdiği bu objektif düzeyindeki yeniden formülasyon, yapay zeka modellerinin daha verimli şekilde küçültülmesine ve pratik uygulamalarda daha başarılı performans göstermesine katkı sağlayacak.