"öz değer" araması — BilimKapsül

Arama Sonuçları

1684 haber

Büyük Dil Modelleri Karmaşık Mantık Sorunlarında Sınırlarına Çarpıyor

Araştırmacılar, büyük dil modellerinin (LLM) mantıksal akıl yürütme yeteneklerini sistematik olarak test eden kapsamlı bir çalışma yürüttü. Sudoku, Hanoi Kulesi ve Rubik Küpü gibi dokuz klasik mantık problemiyle yapılan testlerde, modellerin problem karmaşıklığı arttıkça performanslarının belirgin şekilde düştüğü gözlemlendi. Çalışma, mevcut değerlendirme yöntemlerinin yetersizliğini ortaya koyarak, modellerin gerçek akıl yürütme kapasitelerini ölçmek için kontrollü test ortamları geliştirdi. Bu bulgular, yapay zeka sistemlerinin karmaşık mantıksal problemlerde henüz önemli sınırlarının bulunduğunu gösteriyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka ile Sera İklim Kontrolü: Gizliliği Koruyarak Enerji Tasarrufu

Araştırmacılar, sera işletmelerinin ticari sırlarını paylaşmadan birbirlerinden öğrenebileceği yeni bir yapay zeka sistemi geliştirdi. HierFedCEA adlı bu sistem, kontrollü tarım tesislerinin iklim verilerini gizli tutarken HVAC enerji tüketimini %30-38 oranında azaltabiliyor. Sistem, fizik yasalarından tesise özgü ekipman dinamiklerine kadar üç farklı seviyede öğrenme gerçekleştiriyor. Bu yaklaşım, yeni sera tesislerinin devreye alma süresini aylardan günlere indirgerken, işletmecilerin değerli tarım reçetelerinin gizliliğini de koruyor. Federe öğrenme ve diferansiyel gizlilik tekniklerini kullanan sistem, farklı tipteki seraların ortak bilgi havuzundan faydalanmasını sağlıyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Difüzyon Dil Modellerinde Öngörü Kararsızlığının Gizli Yüzü Ortaya Çıktı

Yapay zeka alanında yeni nesil büyük dil modelleri olan difüzyon dil modellerinin (DLM) beklenmedik bir sorunu keşfedildi. Araştırmacılar, bu modellerin aynı soruya farklı zamanlarda verdikleri yanıtların tutarsız olabildiğini, ancak geleneksel değerlendirme yöntemlerinin bu kararsızlığı maskelediğini ortaya koydu. Mevcut test sistemleri, binlerce örneğin ortalamasına bakarak modelin genel performansını ölçüyor, böylece bireysel örneklerdeki büyük farklılıklar gözden kaçıyor. Bu durum, aynı genel performansa sahip iki model konfigürasyonunun, tekil sorularda tamamen farklı davranabilmesi anlamına geliyor. Araştırma ekibi, her bir örneği ayrı ayrı inceleyerek modellerin ne kadar tutarsız olduğunu daha detaylı ölçen yeni bir değerlendirme sistemi geliştirdi.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Gürültülü Web Ortamında Çoklu Kanıt Toplayan Yapay Zeka Test Platformu

Araştırmacılar, yapay zeka sistemlerinin gerçek web ortamındaki karmaşık arama görevlerini ne kadar iyi yerine getirdiğini ölçmek için MERRIN adlı yeni bir test platformu geliştirdi. Bu platform, AI ajanlarının metin, görsel, ses ve video gibi farklı veri türlerini bir araya getirerek çok adımlı mantıksal çıkarımlar yapabilme yeteneklerini değerlendiriyor. Geleneksel test sistemlerinden farklı olarak, belirsiz doğal dil sorguları kullanıyor ve çelişkili bilgilerin bulunduğu gürültülü web ortamlarını simüle ediyor. GPT ve Gemini gibi güçlü kapalı kaynak modellerden açık kaynak alternatiflere kadar on farklı AI modeli üzerinde yapılan testler, mevcut sistemlerin gerçek dünya koşullarındaki sınırlarını ortaya çıkarıyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

'Yeşil' Blockchain Chia'nın Gerçek Karbon Ayak İzi İddia Edilenden 18 Kat Fazla

Kendisini çevre dostu bir blockchain olarak tanıtan Chia Network'ün gerçek çevresel etkisi, araştırmacılar tarafından kapsamlı bir şekilde incelendi. Proof of Space and Time (PoST) konsensüs mekanizması kullanan Chia, geleneksel Proof-of-Work sistemlerine sürdürülebilir bir alternatif olduğunu iddia ediyor. Ancak Grid'5000 test ortamında yapılan deneysel ölçümler ve teorik modellemeler, Chia'nın yıllık karbon emisyonunun 0.88 milyon ton CO2'ye ulaştığını ortaya koydu. Bu miktar, şirketin iddia ettiği değerin tam 18 katı. Araştırma, Chia'nın kaynak-yoğun başlatma aşaması ve devam eden operasyonlarının, diğer 'yeşil' blockchain'leri büyüklük sırası olarak geride bıraktığını gösteriyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka MongoDB Veritabanlarını Doğal Dille Sorgulayabilecek

Araştırmacılar, doğal dili MongoDB sorgu diline çeviren yeni bir yapay zeka sistemi geliştirdi. EvoMQL adı verilen bu sistem, geleneksel SQL veritabanlarından farklı olarak MongoDB'nin karmaşık yapısını anlayabiliyor. Sistem, Draft-Refine-Optimize döngüleri kullanarak sürekli kendini geliştiriyor ve hatalarından öğrenebiliyor. Bu gelişme, teknik bilgisi olmayan kullanıcıların modern belge tabanlı veritabanlarına kolayca erişmesini sağlayacak. MongoDB'nin iç içe geçmiş şemaları ve belirsiz değer eşlemesi gibi zorluklarla başa çıkabilen sistem, her sorgulama döngüsünde daha doğru sonuçlar üretiyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Sahte yorumlar nasıl tüm sistemi ele geçirebiliyor?

Araştırmacılar, tek bir kötü niyetli kullanıcının online değerlendirme sistemlerini nasıl manipüle edebileceğini inceledi. Çalışma, popülerlik tabanlı derecelendirme sistemlerinin zayıflıklarını ortaya koyuyor. Bulgulara göre, az sayıda stratejik saldırı, geniş çaplı saldırılardan çok daha etkili olabiliyor. Kötü niyetli kullanıcılar, düşük kaliteli ürünleri öne çıkarırken yüksek kaliteli olanları bastırarak sistemin güvenilirliğini ciddi şekilde sarsabiliyor. Araştırma, kullanıcıların farklı davranış kalıplarının bu tür saldırıları nasıl etkileyebileceğini de araştırıyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka ile Şehir Planlaması: Benzer Kentleri Keşfetmenin Yeni Yolu

Araştırmacılar, şehirlerdeki arazi kullanım desenlerini analiz ederek benzer kentleri tespit eden yeni bir yapay zeka metodolojisi geliştirdiler. Copernicus programının Kentsel Atlas verilerini kullanan bu çalışma, veri madenciliği ve denetimsiz öğrenme tekniklerini birleştireyor. Sistem, şehirlerdeki farklı arazi türlerinin nasıl bir arada bulunduğunu inceleyerek kentler arasında benzerlik kuruyor. Bu yaklaşım, şehir plancılarına ve politika yapıcılarına değerli içgörüler sunarak, başarılı kentsel çözümlerin diğer şehirlere uyarlanmasını kolaylaştırabilir. Geliştirilen framework ölçeklenebilir olup, kaynak kodları halka açık olarak paylaşılmış durumda.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

İş dünyası için yapay zeka değerlendirme platformu WorkRB geliştirildi

Günümüzde işe alım süreçleri, yetenek yönetimi ve işgücü analitiği giderek daha fazla yapay zeka destekli öneri sistemlerine dayanıyor. Ancak bu alandaki araştırmalar dağınık ve karşılaştırma yapmak zorlaşıyor. Farklı sınıflandırma sistemleri, çeşitli görev tanımları ve model yaklaşımları kullanılması, çalışmaları birbiriyle kıyaslanabilir olmaktan çıkarıyor. Araştırmacılar, bu soruna çözüm olarak WorkRB adında açık kaynaklı bir değerlendirme platformu geliştirdi. Platform, iş alanına özel yapay zeka uygulamalarını test etmek için özel olarak tasarlandı ve topluluk odaklı bir yaklaşım benimsiyor. Bu çalışma, sektördeki parçalanmışlık sorununa çözüm getirerek, yapay zeka teknolojilerinin iş dünyasındaki performansını daha objektif şekilde değerlendirme imkanı sunuyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Mobil Bankacılık Uygulamalarını Değerlendiriyor

Bangladeş'te yapılan yeni bir araştırma, mobil bankacılık uygulamalarının kullanıcı yorumlarını analiz etmek için farklı yapay zeka modellerini karşılaştırdı. Çalışma, gelişmekte olan ülkelerde milyonlarca kişinin finansal hizmetlere erişimde kullandığı mobil bankacılık uygulamalarının kalitesini ölçmeye odaklandı. Araştırmacılar, 11.414 ham yorumdan filtreledikleri 5.652 İngilizce ve Bengalce Google Play yorumunu inceleyerek, geleneksel makine öğrenmesi modellerinin transformer tabanlı yapay zeka modellerinden daha başarılı olduğunu keşfetti. Bu bulgular, finansal teknoloji uygulamalarının kullanıcı memnuniyetini değerlendirmede hangi analiz yöntemlerinin daha etkili olduğuna dair önemli ipuçları sunuyor.

arXiv (CS + AI) · 28 gün önce

Teknoloji & Yapay Zeka

Korece Yapay Zeka Modelleri Yerel Kültürde Zorlanıyor

Güney Koreli araştırmacılar, yapay zeka modellerinin Korece dilinde ve kültürel bağlamda ne kadar başarılı olduğunu ölçmek için KMMMU adlı yeni bir test sistemi geliştirdi. 3.466 sorudan oluşan bu kapsamlı değerlendirme, matematik, fen bilimleri ve sosyal bilimler gibi dokuz farklı alandaki görselli soruları içeriyor. Test sonuçları oldukça düşündürücü: en güçlü açık kaynak yapay zeka modeli bile sadece %42 başarı gösterirken, ticari modellerin en iyisi zor sorularda %52'ye ulaşabildi. Özellikle Kore kültürüne özgü sorularda performans %13'e varan düşüşler gösterdi. Bu çalışma, yapay zeka modellerinin küresel ölçekte geliştirilmesine rağmen yerel kültür ve dil özelliklerinde hala ciddi eksiklikleri olduğunu ortaya koyuyor.

arXiv (CS + AI) · 28 gün önce

← 1 … 134 135 136 137 138 … 141 →