Yapay Zeka Hukuk Muhakemesinde Yeni Test: LEGIT Veri Seti

Araştırmacılar, yapay zeka modellerinin hukuki muhakeme yeteneklerini değerlendirmek için LEGIT adlı yeni bir veri seti geliştirdi. 24 bin mahkeme kararından oluşan bu veri seti, AI'ların hukuki argümanları ne kadar iyi analiz edebildiğini ölçüyor. Çalışma, mevcut AI modellerinin hukuki konuları kavrama ve doğru sonuçlara varma konularında ciddi eksiklikleri olduğunu ortaya koydu. Mahkeme kararlarını hiyerarşik ağaç yapılarına dönüştüren sistem, tarafların argümanları ile mahkemenin sonuçlarını karşılaştırarak AI'ların muhakeme kalitesini değerlendiriyor.

Yapay zeka modellerinin hukuk gibi uzman alanlardaki muhakeme yeteneklerini değerlendirmek, güvenilirlik ve açıklanabilirlik açısından kritik önem taşıyor. Bu alandaki boşluğu doldurmak için araştırmacılar, LEGIT (Legal Issue Trees) adlı kapsamlı bir veri seti geliştirdi.

24 bin örnek içeren bu uzman düzeyindeki veri seti, mahkeme kararlarını hiyerarşik ağaç yapılarına dönüştürüyor. Bu ağaçlar, karşıt tarafların argümanları ile mahkemenin vardığı sonuçları sistematik olarak organize ediyor ve AI modellerinin muhakeme izlerini değerlendirmek için rubrik görevi görüyor.

Araştırmacılar, bu rubrikların güvenilirliğini uzman hukukçuların değerlendirmeleri ve daha az ayrıntılı rubriklerle karşılaştırma yoluyla doğruladı. LEGIT veri setini kullanarak yapılan testler, mevcut AI modellerinin hukuki muhakemesinde iki temel sorunu olduğunu gösterdi: hukuki konuları tam kapsamlı ele alamama ve yanlış sonuçlara varma.

Öte yandan çalışma, bilgi destekli üretim (RAG) ve rubrik tabanlı pekiştirmeli öğrenme tekniklerinin AI'ların hukuki muhakeme performansını önemli ölçüde iyileştirebildiğini ortaya koydu. Bu gelişme, yapay zekanın hukuk alanındaki uygulamaları için umut verici bir adım olarak değerlendiriliyor.