"program doğrulama" için 173 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
173 haber
Tıpta Yapay Zeka Güvenilirliği İçin Yeni Çerçeve: Kara Kutu Yerine Şeffaf Sistem
Araştırmacılar, klinik yapay zeka sistemlerinin güvenilirliğini artırmak için yeni bir çerçeve geliştirdi. Mevcut AI modellerinin 'kara kutu' yapısından farklı olarak, bu yaklaşım kanıt temelli, denetim altında ve aşamalı özerklik prensiplerine dayanıyor. Çalışma, tıpta AI güvenilirliğinin sadece model doğruluğu veya kullanıcı memnuniyetiyle değil, ölçülebilir sistem özellikleriyle sağlanması gerektiğini vurguluyor. Önerilen sistem, deterministik bir çekirdek, hasta-odaklı AI asistanı, çok katmanlı model yükseltme mekanizması ve insan denetim katmanını birleştiriyor. Bu yaklaşım, kritik bulgularda seçici doğrulama, sınırlı klinik bağlam ve dikkatli değerlendirme süreçleri içeriyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Yapay Zeka Bilim İnsanlarının Hayali Atıflarını Yakalayan Yeni Araç
Araştırmacılar, bilimsel makalelerdeki sahte atıfları tespit eden HalluCiteChecker adlı hafif bir araç geliştirdi. Yapay zeka asistanlarının akademik yazımda yaygınlaşmasıyla birlikte, gerçekte var olmayan çalışmalara yapılan hayali atıflar ciddi bir sorun haline geldi. Bu durum hem bilimsel makalelerin güvenilirliğini sarsiyor hem de hakem ve yazarlara ek iş yükü getiriyor. Yeni araç, standart bir dizüstü bilgisayarda saniyeler içinde doğrulama yapabiliyor ve tamamen çevrimdışı çalışabiliyor. Sadece CPU kullanarak verimli şekilde çalışan sistem, hakem iş yükünü azaltmayı ve akademik kalite kontrolünü desteklemeyi hedefliyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
ClawGym: Yapay Zeka Asistanları için Yeni Eğitim Çerçevesi Geliştirildi
Araştırmacılar, yerel dosyalar ve araçlarla çalışabilen gelişmiş yapay zeka asistanlarının eğitimi için ClawGym adında kapsamlı bir framework geliştirdi. Bu sistem, çok adımlı iş akışlarını yönetebilen AI ajanlarının sistematik bir şekilde eğitilmesi sorununa çözüm getiriyor. ClawGym, 13.500 filtrelenmiş görev içeren geniş bir veri seti ile birlikte, gerçekçi çalışma ortamları ve doğrulama mekanizmaları sunuyor. Framework, kişisel asistan tarzı AI modellerinin geliştirilmesinde tam bir yaşam döngüsü desteği sağlayarak, hem denetimli öğrenme hem de pekiştirmeli öğrenme yöntemlerini kullanıyor. Bu gelişme, günlük hayatta karmaşık görevleri yerine getirebilen daha yetenekli AI asistanlarının geliştirilmesi yolunda önemli bir adım olarak değerlendiriliyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Yapay Zeka Hekimler: Sağlıkta AI'nin AI'yi Değerlendirdiği Yeni Sistem
Sağlık alanında büyük dil modellerinin yaygınlaşmasıyla birlikte, bu sistemlerin değerlendirilmesi kritik hale geldi. Araştırmacılar, yapay zekanın yapay zekayı değerlendirdiği 'LLM-as-a-Judge' yaklaşımını inceledi. Bu sistem, uzman doktor görüşüne alternatif olarak öne çıkıyor ancak güvenlik endişeleri de beraberinde getiriyor. 11 bin 727 çalışmanın tarandığı kapsamlı araştırmada, bu alandaki 49 çalışma detaylı olarak incelendi. Sonuçlar, teknolojinin hızla benimsendiğini ancak doğrulama süreçlerinin yetersiz kaldığını ortaya koyuyor. Çalışmaların çoğunda uzman validator sayısının sadece 3 olduğu, bazılarında ise hiç uzman görüşü alınmadığı tespit edildi.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Yapay Zeka Özetlerindeki Yanlış Bilgileri Tespit Eden Sistem Geliştirildi
Büyük dil modelleri kullanarak veri kümelerinden doğal dil özetleri çıkarmak artık yaygın bir uygulama. Ancak bu özetlerde yer alan iddialar her zaman gerçek verilerle örtüşmüyor. Araştırmacılar bu sorunu çözmek için Evergreen adlı bir sistem geliştirdi. Sistem, yapay zeka tarafından üretilen özetlerdeki iddiaları otomatik olarak doğrulayabiliyor. Özellikle büyük veri kümelerinde sayısal karşılaştırmalar, gruplamalar ve niceleyiciler içeren karmaşık iddiaları kontrol etmede başarılı sonuçlar veriyor. Evergreen, iddia doğrulama sürecini semantik sorgu işleme görevine dönüştürerek çalışıyor ve gereksiz yapay zeka çağrılarını önleyerek maliyet ve gecikmeyi azaltıyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Tıbbi Bilgi Doğrulaması: Karar Vermekten Çok İletişim Kurmalı
Yapay zeka destekli otomatik doğrulama sistemleri birçok alanda başarılı sonuçlar verirken, tıp alanında beklenen ilgiyi göremiyor. Yeni bir araştırma, sosyal medyadan gelen sağlık iddialarını tıp uzmanlarının nasıl doğruladığını inceleyerek, bu durumun nedenlerini araştırıyor. Çalışma, uçtan uca çalışan doğrulama sistemlerinin tıp alanındaki geçerliliğini sorguluyor ve alternatif yaklaşımlar öneriyor. Tıbbi literatürün karmaşıklığı ve halkın sağlık okuryazarlığının yetersizliği, otomatik doğrulama sistemlerine olan ihtiyacı artırsa da, mevcut sistemler pratikte yeterince kullanılmıyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Yapay Zeka Modellerinin Hızını Artıran Yeni 'Gevşek Doğrulama' Yöntemi
Araştırmacılar, büyük dil modellerinin çıkarım hızını artırmak için FLy adlı yeni bir yöntem geliştirdi. Geleneksel spekülatif kod çözme yöntemleri sadece tam eşleşen token'ları kabul ederken, FLy semantik olarak doğru ancak farklı ifadeleri de değerlendiriyor. Sistem, entropy tabanlı iki katmanlı bir mekanizma kullanarak hangi durumlarda alternatif token'ların kabul edilebileceğini belirliyor. Bu yaklaşım, modelin kendi kendini düzeltme yeteneğinden faydalanarak daha esnek bir doğrulama kriteri sunuyor. Özellikle dağıtım dışı görevlerde performans kaybı yaşayan mevcut yöntemlere alternatif olan FLy, ek eğitim gerektirmeden çalışabiliyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Fizikçiler Kuantum Zaman Yolculuğu İçin Yeni Teorik Çerçeve Öneriyor
Türk ve uluslararası araştırmacılar, kuantum mekaniğindeki gizli değişkenleri kullanarak zaman yolculuğunun teorik olarak mümkün olduğunu öne süren yeni bir çalışma yayınladı. Mezoskopik sistemlerdeki yerel kısmi durum yoğunluğu (LPDOS) kavramını kullanan araştırma, bu parametrenin negatif değerler aldığında zaman yolculuğuna olanak sağlayabileceğini iddia ediyor. Çalışma, kuantum ölçüm problemine yeni bir bakış açısı getirirken, Landauer iletkenliğini yeniden yorumluyor. Araştırmacılar, dolaylı deneysel kanıtların varlığından bahsederek, doğrudan deneysel doğrulama beklediklerini belirtiyor. Bu teorik çerçeve, klasik ve kuantum dünyalar arasındaki ara rejimi deneysel olarak inceleme imkanı sunan mezoskopik sistemlere odaklanıyor.
arXiv — Yoğun Madde Fiziği · 16 gün önce
0
Yapay Zeka Görsel Mantığı Nasıl Çözüyor? Yeni Yaklaşım: 'Düşünerek Taslak Çizme'
Araştırmacılar, yapay zekanın görsel problemleri çözerken yaşadığı temel sorunu ele aldı. Mevcut sistemler görselleri algılayabiliyor ama mantıksal yapıları kavrayamıyor. Yeni geliştirilen 'Thinking with Drafting' (TwD) yöntemi, yapay zekanın görsel bilgiyi mantıksal kod yapısına dönüştürmesini sağlıyor. Bu yaklaşım, sistemin doğrudan cevap üretmek yerine düşünce sürecini kodlayarak kendini doğrulamasına olanak tanıyor. Görsel algının mantıksal yapıya dönüştürülmesi süreci 'optik dekompresyon' olarak adlandırılıyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Afrikanka dillerde yapay zeka destekli haber doğrulama sistemi geliştirildi
Araştırmacılar, Afrikanka dillerde yanlış bilgiyle mücadele etmek için özel bir yapay zeka sistemi geliştirdi. AfrIFact adlı bu sistem, on farklı Afrika dilinde ve İngilizcede haber doğrulama işlemi gerçekleştirebiliyor. Sistem, bilgi arama, kanıt toplama ve doğruluk kontrolü olmak üzere üç aşamada çalışıyor. Araştırma sonuçları, mevcut yapay zeka modellerinin farklı diller arasında bilgi arama konusunda yetersiz kaldığını ortaya koydu. Özellikle sağlık alanındaki belgelerin doğruluğunu kontrol etmek, kültürel ve haber içeriklerine göre daha zor olduğu belirlendi. Çalışma, az kaynaklı dillerde yanlış bilgi yayılımının önlenmesi açısından önemli bir adım olarak değerlendiriliyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0
Yapay Zekanın Yalan Dedektifi: HalluHunter Sistemi Geliştirildi
ChatGPT gibi büyük dil modelleri, geniş bilgi birikimleriyle birçok alanda kullanılsa da yanlış bilgi üretme eğilimi gösteriyor. Bu durum sağlık, gazetecilik ve eğitim gibi kritik alanlarda ciddi endişelere yol açıyor. Araştırmacılar, yapay zeka sistemlerindeki faktüel hataları otomatik olarak tespit edebilen HalluHunter adlı yenilikçi bir sistem geliştirdi. Bu sistem, bilgi grafları kullanarak çeşitli soru türleri oluşturuyor ve yapay zekanın verdiği yanıtları sistematik olarak doğruluk açısından test ediyor. Mevcut doğrulama yöntemlerinin aksine, insan emeğine ihtiyaç duymadan çalışabilen bu sistem, yapay zeka güvenilirliğini artırmada önemli bir adım olarak değerlendiriliyor.
arXiv (Dilbilim & NLP) · 16 gün önce
0