Yapay Zeka Modellerinin Sağduyu Değerlendirmesinde Yenilikçi Yöntem Geliştirildi

21 Nisan 2026, 07:00 2 dk okuma 0 görüntülenme arXiv (CS + AI)

Paylaş: Kopyalandı!

Araştırmacılar, yapay zeka modellerinin sağduyu düzeyini ölçmek için ComPaSS adlı yeni bir yöntem geliştirdi. Bu yaklaşım, cümlelere sağduyu bilgisi eklendiğinde ortaya çıkan anlam kaymasını ölçerek makul ve makul olmayan durumları ayırt ediyor. Makul durumlar minimal anlam kaymasına, makul olmayan durumlar ise büyük sapmalara neden oluyor. Büyük dil modelleri ve görsel-dil modellerinde yapılan testler, ComPaSS'ın mevcut yöntemlerden daha başarılı olduğunu gösteriyor. Araştırma, yapay zeka sistemlerinin insan benzeri muhakeme yapabilme kapasitelerinin değerlendirilmesinde önemli bir adım olarak görülüyor.

Yapay zeka araştırmacıları, dil modellerinin sağduyu yetisini değerlendirmek için yenilikçi bir yaklaşım geliştirdi. ComPaSS (Commonsense Plausibility through Semantic Shifts) adı verilen bu yöntem, geleneksel değerlendirme tekniklerinin yetersiz kaldığı ince ayrımları yapmada önemli bir atılım sağlıyor.

Mevcut yaklaşımlar genellikle modellerin verdiği olasılık değerlerine veya sözel yargılarına dayanıyor ancak detaylı ayrımlar yapmakta zorlanıyor. ComPaSS ise farklı bir strateji benimsiyor: cümlelere sağduyu bilgisi eklendiğinde ortaya çıkan anlam değişimlerini ölçüyor. Makul eklentiler minimal anlam kaymasına sebep olurken, makul olmayan durumlar belirgin sapmalar yaratıyor.

Araştırmacıların yaptığı kapsamlı testler, hem büyük dil modelleri hem de görsel-dil modelleri üzerinde ComPaSS'ın üstün performans sergilediğini ortaya koyuyor. Özellikle görsel-dil modellerinin bu görevde daha başarılı sonuçlar verdiği gözlemleniyor.

Bu gelişme, yapay zeka sistemlerinin insan benzeri muhakeme yapabilme kapasitelerinin daha doğru değerlendirilmesi açısından kritik önem taşıyor. ComPaSS'ın ayrımcı yaklaşımı, üretken yöntemlere kıyasla ince sağduyu değerlendirmelerinde belirgin avantajlar sunuyor.

Yapay Zeka Modellerinin Sağduyu Değerlendirmesinde Yenilikçi Yöntem Geliştirildi

Her sabah seçki, Telegram'da

Aynı kategoride okumaya değer

Cinsel Travma Yaşayan Kişilerde Dinsel Saflık Kültürünün Psikolojik Etkileri

Yapay zeka Turing testinde insanlardan daha 'insani' görünüyor

Yapay zeka görselleri insanlar gibi algılamıyor: Doku tanımada büyük fark keşfedildi