“SETI” için sonuçlar
306 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
Yapay zeka araştırmalarında yapılandırılmış düşünce süreçleri daha yaratıcı sonuçlar getiriyor
Araştırmacılar, bilimsel keşif sürecinin fikir geliştirme aşamasını sekiz bilişsel aşamaya bölen SCISENSE adlı yeni bir yapay zeka çerçevesi geliştirdi. Çalışma, yapılandırılmış düşünce süreçlerinin daha serbest yaklaşımlardan daha yaratıcı araştırma çıktıları üretebileceğini gösteriyor. 100 bin ölçekli veri setiyle eğitilen modeller, hedef odaklı eğitimin serbest keşif yaklaşımından %2 daha iyi performans sergilediğini ortaya koydu. Bu bulgular, yapay zekanın bilimsel araştırma süreçlerinde nasıl daha etkili kullanılabileceğine dair önemli ipuçları sunuyor.
Sahte Ses Tespiti İçin Yeni Yapay Zeka Modeli: Alethia
Araştırmacılar, deepfake ses kayıtlarını tespit etmek için özel olarak tasarlanmış yeni bir yapay zeka modeli olan Alethia'yı geliştirdi. Mevcut yöntemlerin sınırlarına ulaştığı bir dönemde, bu model farklı bir yaklaşım benimsiyor. Alethia, maskelenmiş gömülü tahmin ve spektogram yeniden yapılandırma tekniklerini birleştiren yenilikçi bir eğitim reçetesi kullanıyor. 56 farklı veri seti üzerinde yapılan testlerde, model mevcut teknolojileri geride bırakarak üstün performans sergiledi. Özellikle gerçek dünya koşullarındaki bozulmalara karşı dayanıklılığı ve daha önce görmediği alanlardaki başarısı dikkat çekici. Model, şarkı deepfake'leri gibi yeni türdeki sahte ses içeriklerini bile başarıyla tespit edebiliyor.
ToolGrad: Yapay Zeka İçin Daha Etkili Araç Kullanım Veri Setleri Üretimi
Araştırmacılar, büyük dil modellerinin araç kullanma becerilerini geliştirmek için yeni bir yaklaşım geliştirdiler. ToolGrad adlı bu sistem, geleneksel yöntemlerin tersine çalışarak önce geçerli araç kullanım zincirlerini oluşturuyor, sonra bunlara uygun sorular üretiyor. Bu 'cevap-önce' yaklaşımı sayesinde %100'e yakın başarı oranıyla daha karmaşık ve düşük maliyetli veri setleri elde ediliyor. Sistem, metinsel 'gradyanlar' rehberliğinde yinelemeli bir süreç kullanarak araç kullanım zincirlerini inşa ediyor. ToolGrad-500 veri seti üzerinde yapılan deneyler, bu yöntemle eğitilen modellerin hem pahalı temel veri setleriyle hem de özel dil modelleriyle eğitilmiş sistemlerden daha iyi performans gösterdiğini ortaya koyuyor. Bu gelişme, yapay zeka sistemlerinin araç kullanma yeteneklerinin iyileştirilmesinde önemli bir adım teşkil ediyor.
Yapay Zeka Modelleri Kısa Videolardaki Sağlık Dezenformasyonuna Karşı Test Edildi
Araştırmacılar, çok modlu büyük dil modellerinin (MLLM) kısa videolardaki sağlık dezenformasyonunu ne kadar iyi tespit edebildiğini araştırdı. Çalışmada dört sağlık alanından 200 kısa video içeren özel bir veri seti kullanılarak sekiz farklı yapay zeka modeli test edildi. Videolardaki yanıltıcı deneysel sonuçlar, mantık hataları ve uydurma iddialar olmak üzere üç temel aldatma türü incelendi. Sonuçlara göre Gemini-2.5-Pro modeli çok modlu ortamda en yüksek performansı gösterdi. Bulgular, gelişmiş yapay zeka modellerinin bile görsel ve sosyal ipuçlarıyla desteklenen dezenformasyona karşı tam olarak dayanıklı olmadığını ortaya koyuyor.
Yapay Zeka Ajanları İçin Hafıza Mimarilerinde Yeni Birleşik Çerçeve
Büyük dil modeli tabanlı yapay zeka ajanlarının karmaşık görevlerde başarılı olabilmesi için hafıza sistemlerinin kritik önemi ortaya çıkıyor. Araştırmacılar, çok turlu diyaloglar, oyun oynama ve bilimsel keşif gibi uzun soluklu görevlerde ajanların bilgi birikimi, yinelemeli akıl yürütme ve kendini geliştirme yeteneklerini mümkün kılan hafıza yöntemlerini inceledi. Bu kapsamlı çalışmada, mevcut tüm ajan hafıza yöntemlerini kapsayan birleşik bir çerçeve sunuldu ve farklı hafıza yaklaşımları aynı deneysel koşullarda sistematik olarak karşılaştırıldı. İki tanınmış kıyaslama veri setinde yapılan testler, hangi hafıza stratejilerinin daha etkili olduğunu gösterdi. Araştırmanın yan ürünü olarak, mevcut yöntemlerin modüllerini birleştiren yeni bir hafıza tekniği geliştirildi ve bu yöntem en gelişmiş mevcut teknikleri geride bıraktı.
Yapay zeka artık görsel ayrıntıları anlayarak mantıksal çıkarım yapabiliyor
Araştırmacılar, görsel-temelli mantıksal çıkarım yapabilen yeni bir yapay zeka modeli geliştirdi. VGR adlı bu model, geleneksel yaklaşımların aksine sadece metin tabanlı işlem yapmak yerine, görüntülerdeki önemli bölgeleri tespit ederek daha doğru çıkarımlar yapabiliyor. Mevcut çok modlu dil modelleri genellikle matematiksel ve bilimsel problemlerle sınırlıyken, VGR karmaşık görsel anlama gerektiren görevlerde de başarılı sonuçlar veriyor. Model, özel olarak hazırlanmış büyük ölçekli bir veri setiyle eğitilmiş ve görsel grondlama ile dil çıkarımını birleştiren hibrit bir yaklaşım kullanıyor. Bu gelişme, yapay zekanın insan benzeri görsel algı ve mantıksal düşünme süreçlerini daha iyi taklit edebilmesinin önünü açıyor.
Siber Tehdit Avcılığında Yapay Zeka Ajanlarını Test Eden Yeni Ölçüt: ExCyTIn-Bench
Araştırmacılar, büyük dil modellerinin siber güvenlik alanındaki performansını değerlendirmek için ExCyTIn-Bench adlı ilk kapsamlı test setini geliştirdi. Bu yenilikçi araç, gerçek güvenlik analistlerinin karmaşık siber tehditleri araştırma sürecini taklit ederek yapay zeka ajanlarının yeteneklerini ölçüyor. Microsoft Sentinel'den elde edilen 57 farklı log tablosunu içeren kontrollü bir Azure ortamında, 7542 özel soru ile test ediliyor. Sistem, uzman güvenlik analistlerinin mantığını kullanarak tehdit araştırma grafikleri oluşturuyor ve bu grafikler üzerinden yapay zeka ajanlarının çok aşamalı kanıt zincirlerini takip etme yeteneğini değerlendiriyor. Bu gelişme, siber güvenlik alanında otomatik tehdit araştırması yapabilen yapay zeka sistemlerinin geliştirilmesi için kritik bir adım teşkil ediyor.
Yapay Zeka Hukuk Muhakemesinde Yeni Test: LEGIT Veri Seti
Araştırmacılar, yapay zeka modellerinin hukuki muhakeme yeteneklerini değerlendirmek için LEGIT adlı yeni bir veri seti geliştirdi. 24 bin mahkeme kararından oluşan bu veri seti, AI'ların hukuki argümanları ne kadar iyi analiz edebildiğini ölçüyor. Çalışma, mevcut AI modellerinin hukuki konuları kavrama ve doğru sonuçlara varma konularında ciddi eksiklikleri olduğunu ortaya koydu. Mahkeme kararlarını hiyerarşik ağaç yapılarına dönüştüren sistem, tarafların argümanları ile mahkemenin sonuçlarını karşılaştırarak AI'ların muhakeme kalitesini değerlendiriyor.
Dijital Batarya Pasaportu Uyumluluğu için İlk Veri Seti: BatteryPass-12K
Araştırmacılar, Avrupa Birliği'nin yakında yürürlüğe girecek dijital batarya pasaportu (DBP) düzenlemelerine uygunluğu değerlendirmek için BatteryPass-12K adlı ilk kamu veri setini oluşturdu. Gerçek pilot örneklerden sentetik olarak üretilen bu veri seti, yapay zeka modellerinin batarya pasaportlarının düzenlemelere uygunluğunu sınıflandırmasını sağlıyor. Çalışmada 22 farklı dil modeli test edildi ve düşünce modelleri olarak adlandırılan gelişmiş yapay zeka sistemlerinin en başarılı performansı gösterdiği belirlendi. Bu araştırma, sürdürülebilir enerji teknolojilerinin düzenlenmesinde yapay zekanın rolünü artıracak önemli bir adım.
İşaret Dili Yapay Zekası: Dil Bilimsel Analiz İçin Yeni Test Sistemi
Araştırmacılar, işaret dili çeviri modellerinin dil bilimsel yeteneklerini değerlendirmek için yeni bir test sistemi geliştirdi. ASL Minimal Translation Pairs (ASL-MTP) adlı bu veri seti, Amerikan İşaret Dili'ndeki çeşitli dil bilimsel olguları analiz etmek için tasarlandı. Mevcut yapay zeka modelleri konuşma dili işlemede büyük başarılar elde etmişken, işaret dili modellerinin gelişimi geride kalmıştı. Bu çalışma, işaret dilinin çok boyutlu yapısını - el hareketleri, üst vücut ve yüz ifadelerini - ne kadar iyi analiz edebildiklerini test ediyor. Güncel bir İngilizce çeviri modelinin analizi, bu alandaki eksiklikleri ve gelişim alanlarını ortaya koyuyor.
Yapay Zeka Sohbet Robotları Artık Kullanıcıların Niyetlerini Önceden Tahmin Edebiliyor
Araştırmacılar, sohbet robotlarının reaktif yapısını değiştirerek proaktif hale getiren yeni bir model geliştirdi. Geleneksel yapay zeka asistanları sadece mevcut soruya yanıt verirken, yeni sistem kullanıcının gelecekteki niyetlerini önceden tahmin ederek daha verimli diyaloglar kurabiliyor. Temporal Bayesian Network kullanan bu yaklaşım, MultiWOZ 2.2 veri setinde test edildi ve kullanıcı niyetlerinin %75'ini karşılamak için gereken sohbet turlarını 3.95'ten 2.73'e düşürdü. Sistem, mevcut dil modelini değiştirmeden sadece hafif bir rehberlik mekanizması ekleyerek bu başarıyı elde ediyor. Bu gelişme, müşteri hizmetlerinden kişisel asistanlara kadar birçok alanda daha etkili yapay zeka etkileşimleri vaat ediyor.
Konuşma tanıma sistemleri artık insan algısıyla değerlendiriliyor
Fransız araştırmacılar, yapay zeka destekli konuşma tanıma sistemlerinin performansını değerlendirmek için yeni bir yaklaşım geliştirdi. Geleneksel ölçüm yöntemlerinin yetersizliğini fark eden bilim insanları, 143 kişinin katılımıyla HATS adlı veri setini oluşturdu. Bu çalışmada, insanlar farklı konuşma tanıma sistemlerinin ürettiği transkriptler arasından en iyisini seçti. Araştırma, mevcut teknik ölçüm yöntemlerinin insan algısını tam olarak yansıtmadığını ortaya koydu. Yeni yaklaşım, konuşma tanıma teknolojilerinin geliştirilmesinde insan deneyimini merkeze alarak daha kullanıcı odaklı değerlendirme imkanı sunuyor.
Çağrı merkezi sohbetleri, ses tanıma sistemlerini zorluyor
Yapay zeka destekli ses tanıma sistemlerinin gerçek dünya performansını değerlendirmek için yeni bir test veri seti geliştirildi. AppTek Call-Center Dialogues adlı bu koleksiyon, on dört farklı İngilizce aksanında spontan müşteri-temsilci konuşmalarını içeriyor. Araştırma, mevcut açık kaynak ses tanıma sistemlerinin farklı aksanlar karşısında büyük performans farklılıkları gösterdiğini ortaya koyuyor. Bu çalışma, Amerikan İngilizcesi üzerinde iyi performans gösteren sistemlerin, küresel kullanıcı tabanının çeşitli aksanları karşısında aynı başarıyı gösteremediğini kanıtlıyor. Özellikle konuşmalı yapay zeka uygulamaları için kritik olan bu bulgular, ses tanıma teknolojilerinin daha kapsayıcı geliştirilmesi gerektiğine işaret ediyor.
Gizlilik Politikalarını Anlaşılır Hale Getiren Yapay Zeka Sistemi Geliştirildi
Araştırmacılar, karmaşık gizlilik politikalarını sade dille özetleyen yeni bir yapay zeka sistemi geliştirdi. APPSI-139 adlı veri seti, 139 İngilizce gizlilik politikası ve 15.692 yeniden yazılmış metin içeriyor. Kullanıcıların çoğu, uzun ve anlaşılması zor olan bu belgeleri okumadan kabul ediyor. Yeni sistem, hukuki metinlerdeki teknik jargonu günlük dile çevirerek kullanıcıların haklarını daha iyi anlamalarını sağlıyor. Özellikle kişisel verilerin nasıl işlendiği konusunda net bilgiler sunuyor.
Yapay Zeka Modelleri İnsan Kişiliklerini Taklit Ederek Toplumsal Konularda Nasıl Tartışıyor?
Araştırmacılar, büyük dil modellerinin (LLM) farklı insan kişiliklerini ve demografik özelliklerini taklit ederek tartışmalı konularda nasıl görüş bildirdiğini inceledi. 190.000 kayıtlık 'Bilişsel Dijital Gölgeler' veri seti oluşturularak, 19 farklı yapay zeka modelinin aşı, dezenformasyon, cinsiyet eşitsizliği ve STEM alanındaki önyargılar gibi konulardaki yaklaşımları analiz edildi. Çalışma, yapay zekanın toplumsal söylemi nasıl şekillendirebildiğini ve farklı kişilik özelliklerine göre nasıl farklı tepkiler verebildiğini ortaya koyuyor. Bu bulgular, yapay zeka sistemlerinin toplum üzerindeki etkisini anlamak açısından kritik önem taşıyor.
Yapay Zeka Diyalog Sistemleri Nesne Tanımalarında Daha Akıllı Hale Geliyor
Araştırmacılar, görev odaklı diyalog sistemlerinin nesne referanslarını anlama yeteneğini geliştiren yeni bir yöntem önerdi. Büyük dil modellerinin nesne açıklamaları üzerinde mantıksal çıkarım yapmasını sağlayan bu yaklaşım, özellikle karmaşık görsel ortamlarda chatbot'ların hangi nesneden bahsedildiğini daha doğru tespit etmesini mümkün kılıyor. SIMMC 2.1 veri seti üzerinde yapılan testler, bu yöntemin geleneksel supervised öğrenme modellerinin aksine farklı alanlarda daha iyi genelleme yapabildiğini gösteriyor. Sistem, adım adım mantıksal süreçler oluşturarak kullanıcının kastettiği nesneyi daha başarılı şekilde belirleyebiliyor.
Çeviri Yaparken Duygular Kaybolmasın: Küçük Dil Modelleri Test Edildi
Makine çevirisi teknolojisinde anlam doğruluğu kadar duygusal bütünlük de önemli. Araştırmacılar, EuroLLM, Aya Expanse ve Gemma gibi üç gelişmiş küçük dil modelinin çeviri sırasında ince duygusal nüansları ne kadar koruduğunu inceledi. GoEmotions veri seti kullanılarak yapılan çalışmada, Reddit yorumlarındaki 28 farklı duygu kategorisi beş Avrupa dilinde test edildi. Sonuçlar, mevcut çeviri sistemlerinin semantik eşdeğerliği korumada başarılı olmasına rağmen, duygusal sadakati sağlamada hala zorluklar yaşadığını gösteriyor. Bu araştırma, gelecekte daha empatik ve duygusal açıdan hassas çeviri teknolojilerinin geliştirilmesi açısından önem taşıyor.
Almanca yapay zeka modelleri için kaliteli veri tekrarı çeşitlilikten daha etkili
Araştırmacılar, Almanca gibi kaynak bakımından zengin dillerde yapay zeka dil modellerini eğitirken önemli bir ikilemle karşılaştı: Geniş ve çeşitli veri setleriyle tek seferlik eğitim mi, yoksa küçük ama kaliteli veri setleriyle çok epochluk eğitim mi daha etkili? 500 milyon web dokümanı üzerinde yapılan kapsamlı deneyler, yüksek kaliteli verilerin tekrarlanmasının beklenenden çok daha başarılı olduğunu ortaya koydu. Sonuçlar, aynı veri seti 7 kez tekrarlandığında bile performans artışının devam ettiğini gösteriyor. Bu bulgular, dil modeli eğitiminde veri kalitesinin çeşitlilikten daha kritik olduğunu ve sınırlı kaynaklarla çalışan araştırmacılar için önemli bir strateji değişikliği önerisi sunuyor.
Yapay Zeka Sorgu Geliştirme Sistemlerinin Güvenilirliği Test Edildi
Büyük Dil Modelleri (LLM) bilgi arama sistemlerinde sorguları yeniden düzenlemek ve genişletmek için yaygın olarak kullanılıyor. Ancak bu sistemlerin etkinliği konusundaki araştırma sonuçları farklı koşullarda elde edildiği için hangilerinin güvenilir olduğunu anlamak zorlaşıyor. Yeni bir çalışma, on farklı LLM tabanlı sorgu geliştirme yöntemini aynı kontrollü koşullarda test etti. Araştırma, iki farklı LLM ailesini, üç arama paradigmasını ve dokuz kıyaslama veri setini kullanarak kapsamlı bir analiz gerçekleştirdi. Sonuçlar, sorgu geliştirme başarısının kullanılan arama yöntemine bağlı olduğunu ve geleneksel arama sistemlerinde görülen iyileştirmelerin modern yoğun arama sistemlerine aktarılamadığını gösteriyor.
Yapay Zeka Arama Motorlarını Nasıl Değiştiriyor? 11.500 Sorguyla Test Edildi
Araştırmacılar, yapay zekanın geleneksel arama motorlarını nasıl dönüştürdüğünü anlamak için kapsamlı bir çalışma gerçekleştirdi. 11.500 kullanıcı sorgusundan oluşan benchmark veri setiyle Google Arama, AI Overview ve Gemini Flash 2.5'i karşılaştıran araştırma, çarpıcı bulgular ortaya koydu. Sonuçlara göre, kullanıcı sorgularının yarısından fazlasında (%51.5) AI Overview'lar oluşturuluyor ve organik arama sonuçlarının üzerinde gösteriliyor. Özellikle tartışmalı konularda AI özetlerinin daha sık görüldüğü tespit edildi. Çalışma ayrıca farklı arama sistemlerinin kaynaklarını seçme biçimlerinin önemli ölçüde farklılaştığını gösteriyor. Bu araştırma, yapay zekanın arama deneyimini nasıl şekillendirdiğini ve bilgiye erişim şeklimizi nasıl değiştirdiğini anlamamız açısından kritik bulgular sunuyor.
NanoKnow: Yapay Zekanın Bilgi Kaynağını Haritalandıran Yeni Araştırma
Büyük dil modelleri nasıl öğrendiklerini nereden biliyorlar? Bu sorunun cevabı, eğitim verilerinin genellikle 'kara kutu' gibi kapalı olması nedeniyle zor bulunuyordu. Araştırmacılar, tamamen açık eğitim verileriyle geliştirilmiş nanochat modellerini kullanarak NanoKnow adlı yeni bir veri seti geliştirdi. Bu çalışma, yapay zekanın parametrik bilgisinin nereden geldiğini şeffaf bir şekilde gösteriyor. NanoKnow, Natural Questions ve SQuAD veri setlerindeki soruları, cevaplarının nanochat'in eğitim korpusunda bulunup bulunmamasına göre ayırarak, dil modellerinin çıktı üretirken hangi bilgi kaynaklarına güvendiğini anlamayı mümkün kılıyor. Sekiz farklı nanochat checkpoint'i üzerinde yapılan deneyler, kapalı kitap doğruluğunun eğitim verilerindeki cevap sıklığından güçlü şekilde etkilendiğini ortaya koyuyor.
Konuşma Tabanlı Yapay Zeka Modelleri İçin Yeni Değerlendirme Standardı
Araştırmacılar, konuşma tabanlı büyük dil modellerinin gerçek dünya performansını ölçmek için DoWhatISay (DOWIS) adlı yeni bir veri seti geliştirdi. Bu çok dilli veri seti, 9 farklı görevi ve 11 dili kapsayarak, yapay zeka modellerinin sesli talimatları ne kadar iyi anlayıp uygulayabildiğini test ediyor. Mevcut değerlendirme yöntemleri çoğunlukla yazılı metinlere dayanıyor, ancak gerçek hayatta insanlar bu sistemlerle konuşarak etkileşim kuruyor. Araştırma sonuçları, yazılı talimatların hala sesli talimatlara göre daha iyi sonuçlar verdiğini, özellikle az kaynaklı dillerde bu farkın daha belirgin olduğunu ortaya koyuyor. Bu çalışma, konuşma tabanlı AI sistemlerinin geliştirilmesi için önemli bir adım teşkil ediyor.
Finans raporlarını anlayan yapay zeka sistemi FinCARDS geliştirildi
Araştırmacılar, şirket mali raporlarındaki karmaşık soruları yanıtlayabilen yeni bir yapay zeka sistemi geliştirdi. FinCARDS adlı bu sistem, geleneksel AI yaklaşımlarından farklı olarak finansal verileri yapılandırılmış bir şekilde analiz ediyor. Sistem, şirket adları, finansal metrikler, mali dönemler ve sayısal değerler gibi kritik bilgileri ayrı ayrı değerlendirerek daha doğru sonuçlar üretiyor. Mevcut AI sistemleri genellikle anlam benzerliğine odaklanırken, FinCARDS finansal raporların katı kısıtlarını göz önünde bulunduruyor. Çok aşamalı bir sıralama sistemi kullanarak kanıt topluyor ve kararlarının izini sürebilir hale getiriyor. İki farklı finansal soru-cevap veri setinde yapılan testlerde, hem geleneksel hem de AI tabanlı sistemlerden önemli ölçüde daha iyi performans gösterdi.
Robot Elleri Artık Dokunma Hissini Yaşayabilecek: DAIMON'dan Devrim
Hong Kong merkezli DAIMON Robotics, robotlara gelişmiş dokunma duyusu kazandırmak için çığır açan bir teknoloji geliştirdi. Şirket, parmak ucu büyüklüğündeki modülde 110.000'den fazla algılama birimi barındıran yüksek çözünürlüklü dokunsal sensör teknolojisiyle dikkat çekiyor. Bu Nisan ayında yayınlanan Daimon-Infinity veri seti, fiziksel yapay zeka için geliştirilmiş en kapsamlı çok modlu robotik veri tabanı olarak tanıtılıyor. Ev işlerinden fabrika montaj hatlarına kadar geniş bir yelpazede görevleri kapsayan bu proje, Google DeepMind, Northwestern Üniversitesi ve Singapur Ulusal Üniversitesi gibi önde gelen kurumların desteğini alıyor. İki buçuk yaşındaki DAIMON'un bu hamlesi, robotların çevreleriyle etkileşim kurma biçimini kökten değiştirme potansiyeli taşıyor.