Yazılım geliştirme sürecinde karşılaşılan en önemli zorluklardan biri, kodda bulunan gizli tasarım hatalarının tespit edilmesidir. 'Kod kokusu' olarak bilinen bu durumlar, yazılımın uzun vadeli bakımını ve gelişimini olumsuz etkileyebilir.

Araştırmacılar, bu soruna makine öğrenmesi teknikleriyle çözüm aramakta, ancak kaliteli eğitim veri setlerinin eksikliği büyük bir engel oluşturmaktadır. Manuel veri hazırlama süreci, uzman bilgisi gerektirmesi ve oldukça zaman alıcı olması nedeniyle pratik değildir. Öte yandan, tamamen otomatik üretilen veri setleri ise etiket güvenilirliği ve veri kalitesi açısından sorunlu olabilmektedir.

Bu zorluğun üstesinden gelmek için geliştirilen SACS (Semi-Automatic Code Smell) veri seti, yarı otomatik bir yaklaşım benimsiyor. Bu yöntem, hem otomatik üretimin verimliliğinden hem de manuel kontrolün kalitesinden yararlanarak dengeli bir çözüm sunuyor.

Yazılım mühendisliğinde kod kalitesinin artırılması, hem geliştirici verimliliği hem de yazılım güvenilirliği açısından kritik önem taşıyor. Bu yeni veri seti, gelecekte daha akıllı kod analiz araçlarının geliştirilmesine katkıda bulunabilir.