Yapay zeka ve büyük dil modellerinin günlük yaşamımızda artan rolüyle birlikte, farklı dillerde içerik güvenliği kontrolü kritik bir konu haline geldi. Araştırmacılar, Polonyaca dil uygulamaları için özel olarak tasarlanmış Bielik Guard adlı yeni bir güvenlik sınıflandırıcısı ailesini geliştirdi.

İki farklı boyutta sunulan bu modeller, Polonyaca metinleri beş temel güvenlik kategorisinde değerlendiriyor: nefret söylemi ve saldırganlık, küfür ve argo ifadeler, cinsel içerik, suç teşvik edici içerik ve kendine zarar verme. Küçük model 0.1 milyar, büyük model ise 0.5 milyar parametre içeriyor.

Modellerin eğitimi için topluluk katkısıyla hazırlanan 6.885 Polonyaca metin kullanıldı. Test sonuçları, büyük modelin F1 skorunda 0.791 (mikro) ve 0.785 (makro) başarı elde ettiğini gösteriyor. Küçük model ise daha az kaynak tüketirken yüksek hassasiyet sunuyor.

Bu gelişme, Polonyaca konuşulan ülkelerde sosyal medya platformları, çevrimiçi forumlar ve yapay zeka uygulamaları için güvenli içerik kontrolü sağlayacak. Özellikle gerçek zamanlı uygulamalar için optimize edilen kompakt yapısı, pratik kullanımda önemli avantajlar sunuyor.