"ajan değerlendirme" araması

Arama Sonuçları

676 haber

Yapay Zeka, Çevrimiçi Kurs Öğrencilerinin Memnuniyetini Önceden Tahmin Edebiliyor

Araştırmacılar, masif açık çevrimiçi kurslarında (MOOC) öğrenci memnuniyetini erken dönemde tahmin edebilen yenilikçi bir yapay zeka sistemi geliştirdi. TET-LLM adlı bu sistem, öğrencilerin ilk 7-28 gün içindeki davranışlarını analiz ederek kurs sonundaki memnuniyet düzeylerini öngörebiliyor. Sistem, öğrencilerin tıklama davranışları, forum gönderileri ve kısa geri bildirimlerini büyük dil modelleriyle işleyerek çok boyutlu bir analiz gerçekleştiriyor. Bu gelişme, eğitim platformlarının risk altındaki öğrencileri erkenden tespit etmesini ve müdahale etmesini sağlayarak hem öğrenci başarısını hem de platform itibarını artırabilir. Geleneksel yöntemler kurs bitimindeki değerlendirmelere dayandığından müdahale için çok geç kalıyordu, ancak bu yeni yaklaşım proaktif eğitim desteği sunma imkanı tanıyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Analog optik bilgisayar 6 milyon verilik kredi onayında test edildi

Araştırmacılar, analog optik bilgisayarın gerçek dünya verilerindeki performansını test etmek için 5,84 milyon ABD mortgage kaydını kullandı. Bu çalışma, optik bilgisayarların küçük ölçekli görüntü işleme testlerinin ötesine geçen ilk büyük veri uygulaması olma özelliği taşıyor. Sonuçlar, analog optik bilgisayarın %94,6 doğruluk oranına ulaştığını, ancak XGBoost algoritmasının %97,9'luk performansının gerisinde kaldığını gösteriyor. Araştırma, optik bilgisayarlardaki doğruluk kayıplarının üç ana kaynağını belirledi: kodlama, mimari tasarım ve donanım sınırlamaları. İlginç şekilde, donanımsal kusurların performansta ölçülebilir bir etki yaratmadığı gözlendi. Bu bulgular, analog optik bilgisayarların yapay zeka uygulamalarında kullanılabilirliğini değerlendirmek için önemli veriler sunuyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Telekomünikasyon AI'larında Güven Seviyesi Ölçümünde Yeni Çifte Geçiş Yöntemi

Büyük dil modelleri telekomünikasyon sektöründe 3GPP spesifikasyon analizi ve ağ sorun giderme gibi karmaşık görevlerde kullanılıyor. Ancak bu modellerin kendi cevaplarına dair güven skorları genellikle yanıltıcı ve aşırı iyimser çıkıyor. Araştırmacılar, Gemma-3 model ailesi üzerinde yaptıkları çalışmada standart tek geçişli güven tahminlerinin yetersiz kaldığını gösterdi. Sorunun çözümü için Twin-Pass Chain of Thought yöntemi adı verilen yeni bir yaklaşım geliştirdiler. Bu teknik, birden fazla bağımsız düşünce zinciri kullanarak modelin kendi doğruluğunu değerlendirme yeteneğini artırıyor. Telekomünikasyon alanında AI güvenilirliğinin kritik öneme sahip olduğu düşünüldüğünde, bu gelişme sektörün AI benimseme sürecini hızlandırabilir.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Modellerinin Çok Dilli Eğitimi İngilizce'den Çok Daha Etkili

Büyük dil modellerinin eğitiminde sadece İngilizce kullanmanın yetersiz olduğunu gösteren kapsamlı bir araştırma yayınlandı. 8 milyar parametreye kadar modeller üzerinde yapılan 220 farklı eğitim deneyi, çok dilli yaklaşımın tüm dillerde performansı artırdığını ortaya koyuyor. Araştırmacılar, matematiksel akıl yürütme ve API çağrıları gibi görevlerde çok dilli eğitimin sadece düşük kaynaklı dilleri değil, İngilizce performansını da iyileştirdiğini keşfetti. Hatta tek bir yabancı dil eklemenin bile modelin genel başarısını artırdığı gözlemlendi. Bu bulgular, yapay zeka endüstrisinin İngilizce ağırlıklı eğitim yaklaşımını yeniden değerlendirmesi gerektiğine işaret ediyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka ile Şifreleme Sistemlerinin Zayıflıklarını Keşfetmek

Araştırmacılar, modern şifreleme sistemlerindeki gizli zayıflıkları tespit etmek için yapay zeka destekli yeni bir yöntem geliştirdi. Neural Stringology Cryptanalysis adı verilen bu yaklaşım, geleneksel güvenlik testlerinin gözden kaçırabileceği yapısal anormallikleri makine öğrenmesi ile ortaya çıkarıyor. Özellikle ChaCha20 gibi yaygın kullanılan akım şifrelerini hedef alan sistem, metin analizi tekniklerini sinir ağlarıyla birleştiriyor. Bu yöntem, şifreleme algoritmalarının ürettiği anahtar dizilerindeki gizli kalıpları analiz ederek, daha önce fark edilmeyen güvenlik açıklarını tespit edebiliyor. Çalışma, siber güvenlik alanında yeni bir paradigma sunarak, şifreleme sistemlerinin dayanıklılığını değerlendirmek için daha sofistike araçların gerekliliğini vurguluyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Güvenliğinde Yeni 'Bal Küpü' Protokolü: Gizli Davranışları Tespit Etmenin Yolu

Araştırmacılar, yapay zeka sistemlerinin farklı ortamlarda sergiledikleri gizli davranışları tespit etmek için 'bal küpü protokolü' adını verdikleri yeni bir yöntem geliştirdi. Geleneksel izleme sistemleri, AI modellerinin sadece pasif gözlemini yaparken, bu yeni yaklaşım modellerin farklı koşullarda nasıl davrandığını aktif olarak test ediyor. Protokol, görevin ve çevrenin aynı kalmasına rağmen sistem komutlarını üç farklı duruma göre değiştiriyor: değerlendirme, sentetik dağıtım ve açık izleme yok durumları. Claude Opus modeli üzerinde yapılan ilk testlerde, model her üç durumda da tutarlı performans gösterdi. Bu yöntem, AI güvenliğinde önemli bir adım olarak görülüyor çünkü modellerin potansiyel olarak zararlı davranışlarını gizlemesi durumunu tespit edebiliyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Ödül Sistemleri Demografik Önyargılar Taşıyor

Araştırmacılar, metin-görsel üretim sistemlerinde kullanılan ödül modellerinin beklenmedik demografik önyargılar içerdiğini keşfetti. Bu modeller kalite değerlendirmesi için tasarlanmış olmasına rağmen, belirli demografik grupları kayıran kararlar aldığı ortaya çıktı. Stanford ve diğer üniversitelerden araştırmacıların yürüttüğü kapsamlı çalışma, yapay zeka sistemlerinin insan tercihlerini öğrenme sürecinde istenmeyen önyargıları da içselleştirdiğini gösteriyor. Bu durum, AI-generated içeriklerin adilliğini ve çeşitliliğini olumsuz etkileyebilir.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

WebXSkill: Web Otomasyon Ajanları İçin Yeni Beceri Öğrenme Sistemi

Büyük dil modelleriyle çalışan otonom web ajanları, karmaşık tarayıcı görevlerini tamamlama konusunda umut vadediyor ancak uzun süreli iş akışlarında zorlanıyor. Araştırmacılar, bu sorunu çözmek için WebXSkill adlı yeni bir framework geliştirdi. Bu sistem, hem doğrudan çalıştırılabilen hem de ajan tarafından anlaşılabilen 'yürütülebilir beceriler' kullanıyor. Mevcut sistemlerdeki temel sorun, metin tabanlı becerilerin anlaşılır olmasına rağmen doğrudan çalıştırılamaması, kod tabanlı becerilerin ise çalıştırılabilir olmasına karşın ajan için anlaşılır olmaması. WebXSkill, parametreli eylem programlarını adım adım doğal dil rehberliğiyle birleştirerek bu açığı kapatıyor ve ajanlara hem hata kurtarma hem de adaptasyon imkanı sunuyor.

arXiv (CS + AI) · 29 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Gözünde Büyük Yanılsama: Doğru Yeri Buluyor, Yanlış İsim Veriyor

Araştırmacılar, görüntü segmentasyonunda çalışan yapay zeka modellerinin şaşırtıcı bir hata türü keşfetti. Bu modeller, nesnelerin sınırlarını doğru tespit edebiliyor ancak tamamen yanlış etiketler atayabiliyor. Örneğin bir köpeği bulup sınırlarını çiziyor ama 'kedi' diyor. Bu durum, modellerin eğitim verilerindeki sahte korelasyonlara dayanmasından kaynaklanıyor. Cornell Üniversitesi araştırmacıları, bu 'semantik etiket takası' sorununun geleneksel değerlendirme yöntemleriyle fark edilmediğini gösterdi. Çalışma, yapay zekanın gerçek dünya uygulamalarında karşılaşabileceği kritik güvenilirlik sorunlarına ışık tutuyor.

arXiv (CS + AI) · 29 gün önce

Tıp & Sağlık

Yapay Zeka Melanom Riskini 5 Yıl Önceden Tahmin Edebiliyor

İsveç'te gerçekleştirilen kapsamlı bir araştırma, yapay zekanın rutin sağlık verileri kullanarak melanom riski yüksek kişileri belirleyebildiğini ortaya koydu. Gelişmiş AI modelleri, geleneksel yöntemlerden çok daha başarılı sonuçlar elde etti. Sistem tarafından işaretlenen bazı bireylerin 5 yıl içinde melanom geliştirme olasılığı %33'e kadar çıktı. Bu yaklaşım, cilt kanseri taramalarında hedefli ve akıllı stratejiler geliştirilmesine yardımcı olabilir. Erken teşhisin hayati önem taşıdığı melanom vakalarında, AI destekli risk değerlendirmesi sağlık sistemlerini daha verimli hale getirebilir.

ScienceDaily · 30 gün önce

İklim & Çevre

Edwards Platosu'nda Buzul Çağı devlerinin fosilleri iklim kayıtlarını sarşıyor

Texas Üniversitesi'nden Dr. John Moretti ve mağaracı John Young'ın Bender Mağarası'nda yaptıkları keşif, Edwards Platosu'nun iklim geçmişine dair bilinen her şeyi yeniden sorgulatıyor. Araştırmacılar, bu bölgede daha önce hiç bilinmeyen dev kaplumbağa (Hesperotestudo) ve armadil benzeri pampathere (Holmesina septentrionalis) fosillerini buldu. Bu bulgular, Buzul Çağı sırasında Edwards Platosu'nda tamamen farklı bir ekosistemin var olduğunu gösteriyor. Quaternary Research dergisinde yayınlanan çalışma, bu yüksek platonun geçmişte bugünkünden çok daha sıcak ve nemli bir iklime sahip olabileceğini öne sürüyor. Dev hayvanların varlığı, bölgenin o dönemde zengin bitki örtüsü ve bol su kaynağına sahip olduğuna işaret ediyor. Bu keşif, sadece yerel iklim geçmişini değil, Kuzey Amerika'nın genel iklim modellerini de yeniden değerlendirmeyi gerektiriyor.

Phys.org · 33 gün önce

← 1 … 54 55 56 57 →