Teknoloji & Yapay Zeka

Yapay Zeka Modelleri Neden Farklı Bilgileri Unutuyor?

Araştırmacılar, görüntü sınıflandırma yapay zeka modellerinin eğitim sırasında hangi bilgileri unuttuğunu inceledi. ResNet-18 ve DeiT-Small mimarilerini göz hastalıkları ve kuş türleri veri setleri üzerinde test eden çalışma, farklı yapay zeka mimarilerinin tamamen farklı örnekleri unuttuğunu keşfetti. Vision Transformer (ViT) modellerinin unutma süreçlerinin CNN'lere göre daha düzenli olduğu, ancak her iki mimaride de unutmanın rastgele faktörlerden etkilendiği belirlendi. Bu bulgular, yapay zeka eğitim programlarının tasarımı, veri temizleme süreçleri ve farklı modellerin birlikte kullanılması konularında önemli ipuçları sunuyor.

Yapay zeka modellerinin eğitimi sırasında hangi bilgileri unuttuğu ve bu sürecin model mimarisine nasıl bağlı olduğu, ilk kez bu detayda araştırıldı. Bilim insanları, ResNet-18 ve DeiT-Small olmak üzere iki farklı yapay zeka mimarisini göz hastalıkları teşhisi ve kuş türü tanıma görevlerinde test etti.

Araştırma sonuçları şaşırtıcı bulgular ortaya koydu. İki farklı mimari, eğitim sürecinde tamamen farklı örnekleri unutuyor: en çok unutulan örneklerin yalnızca yüzde 15-34'ü ortak. Bu, her mimarinin kendine özgü bir 'unutma profili' olduğunu gösteriyor.

Vision Transformer (ViT) mimarisinin unutma süreci, geleneksel CNN'lere kıyasla daha düzenli ve öngörülebilir. ViT'ler Ebbinghaus'un unutma eğrisine daha uygun davranırken, CNN'lerin unutma paterni daha karmaşık.

Önemli bir bulgu da unutmanın rastgelelik içermesi. Aynı model farklı başlangıç koşullarıyla eğitildiğinde, unutma süreçleri arasındaki korelasyon oldukça düşük kalıyor.

Bu keşifler, yapay zeka eğitim programlarının nasıl tasarlanacağı, hangi verilerin temizleneceği ve farklı modellerin nasıl birleştirileceği konularında yeni perspektifler sunuyor. Unutmanın mimari-bağımlı olması, ensemble yöntemlerinin etkinliğini artırabilir.

Özgün Kaynak
arXiv (CS + AI)
Not All Forgetting Is Equal: Architecture-Dependent Retention Dynamics in Fine-Tuned Image Classifiers
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.