Bilim insanları, biyolojik dizilerin analizinde devrim yaratabilecek yeni bir kodlama çerçevesi geliştirdi. Multi-Scale Reversible Chaos Game Representation (MS-RCGR) adı verilen bu sistem, DNA ve protein dizilerini çok çözünürlüklü geometrik görsellere dönüştürüyor.
Sistemin en dikkat çekici özelliği tam tersine çevrilebilir olması. Bu, dönüştürme sırasında hiçbir bilginin kaybolmadığı ve orijinal dizi verisinin tamamen geri elde edilebileceği anlamına geliyor. Araştırmacılar, rasyonel aritmetik ve hiyerarşik k-mer ayrıştırma tekniklerini kullanarak bu başarıyı elde etmiş.
MS-RCGR, üç farklı analiz yaklaşımını birleştiriyor: klasik makine öğrenmesi yöntemleri geometrik özellikler üzerinde çalışırken, bilgisayar görüşü modelleri oluşturulan görüntüler üzerinde işlem yapıyor. Hibrit yaklaşımlar ise protein dil modeli gömme vektörlerini CGR özellikleriyle birleştiriyor.
Sentetik DNA ve protein veri setleri üzerinde yapılan kapsamlı deneylerde, sistemin yedi farklı dizi sınıflandırma görevinde başarılı olduğu görüldü. Bu gelişme, biyoinformatik alanında dizilerin yorumlanabilir şekilde sınıflandırılması için önemli bir adım sayılıyor.