Teknoloji & Yapay Zeka

Raven: Scratch Programları için Video Temelli Otomatik Değerlendirme Sistemi

Araştırmacılar, programlama eğitiminde yaygın kullanılan Scratch için yeni bir otomatik değerlendirme sistemi geliştirdi. Raven adlı bu sistem, geleneksel test tabanlı yöntemler yerine video analizi ve büyük dil modellerini kullanarak Scratch programlarını değerlendiriyor. Sistem, öğretmenlerin manuel inceleme yükünü azaltırken daha tutarlı ve ölçeklenebilir değerlendirme imkanı sunuyor. Scratch programlarının görsel ve etkileşimli doğası nedeniyle zorlu olan otomatik değerlendirme sorununa, programların çalışma videolarını analiz ederek çözüm getiriyor.

Eğitim dünyasında blok tabanlı programlama ortamları olan Scratch gibi araçlar giderek daha fazla kullanılıyor ancak bu programların otomatik değerlendirilmesi önemli zorluklar barındırıyor. Araştırmacılar bu soruna yenilikçi bir çözüm geliştirdi: Raven sistemi.

Scratch programları, geleneksel programlama dillerinden farklı olarak olay güdümlü çalışır ve görsel çıktılara odaklanır. Bu özellikler nedeniyle standart test tabanlı değerlendirme yöntemleri yetersiz kalıyor. Mevcut durumda öğretmenler, öğrencilerin Scratch projelerini manuel olarak incelemek zorunda kalıyor ki bu hem tutarsızlık yaratıyor hem de ölçekleme sorunlarına yol açıyor.

Raven sistemi, bu zorluğu aşmak için farklı bir yaklaşım benimsiyor. Sistem, program kodunu doğrudan test etmek yerine programın çalıştırıldığı sırada oluşan videoları analiz ediyor. Öğretmenler, her öğrenci projesi için ayrı test senaryoları yazma zorunluluğu olmadan genel değerlendirme kuralları belirleyebiliyor.

Sistemin çalışma mantığı büyük dil modelleri ile video analizi teknolojilerini birleştirmesi üzerine kurulu. Bu sayede programın görsel davranışları ve etkileşimli özellikleri değerlendirme kriterlerine göre otomatik olarak analiz ediliyor. Özellikle giriş seviyesi programlama eğitiminde bu yaklaşımın önemli avantajlar sağlayacağı öngörülüyor.

Raven'ın getirebileceği en büyük yenilik, öğretmenlerin değerlendirme sürecindeki iş yükünü azaltırken tutarlı ve objektif değerlendirme olanağı sunması. Bu durum, programlama eğitiminin daha geniş kitlelere ulaşabilmesi için kritik öneme sahip.

Özgün Kaynak
arXiv (CS + AI)
Raven: Rethinking Automated Assessment for Scratch Programs via Video-Grounded Evaluation
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.