"metin madenciliği" için 334 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
334 haber
NeuralSet: Beyin ve Yapay Zeka Araştırmalarını Birleştiren Python Platformu
Nörobilim ve yapay zeka arasındaki köprüyü güçlendiren yeni bir yazılım çerçevesi geliştirildi. NeuralSet adlı bu Python platformu, fMRI, EEG ve nöron kayıtları gibi farklı beyin görüntüleme tekniklerinden elde edilen verileri tek bir arayüzde birleştiriyor. Araştırmacılar artık metin, ses ve video gibi karmaşık deneysel uyaranları da aynı sistemde işleyebilecek. Platform, büyük veri setleriyle çalışmayı kolaylaştırırken, derin öğrenme modellerini nörobilim araştırmalarına entegre etmeyi sağlıyor. Bu gelişme, beynin bilgi işleme süreçlerini anlamada yapay zekadan yararlanmak isteyen bilim insanları için önemli bir adım.
arXiv (Nörobilim) · 3 gün önce
0
Beyin Verilerini Analiz Eden Yeni Yazılım Kütüphanesi: LITcoder
Araştırmacılar, beyin verilerini metin ve konuşma gibi uyaranlarla eşleştiren yeni bir açık kaynak yazılım kütüphanesi geliştirdi. LITcoder adlı bu araç, nöral kodlama modelleri oluşturmak ve karşılaştırmak için standartlaştırılmış bir platform sunuyor. Kütüphane, sürekli uyaranları beyin verileriyle hizalama, uyaranları temsili özelliklere dönüştürme ve bu özellikleri beyin verilerine eşleme işlemlerini kolaylaştırıyor. Modüler yapısı sayesinde araştırmacılar farklı metodolojik seçenekleri kolayca birleştirebilir ve karşılaştırabilir. Sistem, beyin veri setleri, beyin bölgeleri, uyaran özellikleri ve örnekleme yaklaşımları gibi geniş bir yelpazedeki seçenekleri destekliyor. Bu gelişme, nörobilim araştırmalarında standardizasyon ve tekrarlanabilirlik açısından önemli bir adım teşkil ediyor.
arXiv (Biyoloji) · 9 gün önce
0
Yapay Zeka Görüntüleri Tanıyor Ama Sayamıyor: Araştırmacılar Çözüm Arıyor
Günümüzün yapay zeka sistemleri görüntüleri tanımlayabiliyor, nesneleri ayırt edebiliyor ve karmaşık ilişkileri açıklayabiliyor. Görsel-dil modelleri olarak adlandırılan bu sistemler, metin ve görüntü anlayışını etkileyici şekillerde birleştiriyor. Ancak şaşırtıcı bir şekilde, görünüşte basit olan sayma işleminde zorlanıyorlar. Hof Uygulamalı Bilimler Üniversitesi araştırmacıları, yapay zekanın bu temel eksikliğini gidermek için yeni çalışmalar yürütüyor. Bu durum, AI teknolojisinin hızla gelişmesine rağmen bazı temel bilişsel yeteneklerde hala sınırları olduğunu gösteriyor.
TechXplore — Bilgisayar Bilimleri · 10 gün önce
0
Portekizce için Geliştirilen NorBERTo Yapay Zeka Modeli 331 Milyar Token ile Eğitildi
Brezilya'daki araştırmacılar, Portekizce doğal dil işleme alanında çığır açan yeni bir yapay zeka modeli geliştirdi. NorBERTo adlı bu model, ModernBERT mimarisine dayalı olarak tasarlandı ve Aurora-PT adı verilen dev bir Portekizce veri kümesi ile eğitildi. Bu veri kümesi, çeşitli web kaynaklarından toplanan 331 milyar GPT-2 token içeriyor. Model, metin benzerliği, mantıksal çıkarım ve sınıflandırma görevlerinde test edildiğinde, özellikle PLUE ve ASSIN 2 benchmark testlerinde kayda değer başarılar elde etti. NorBERTo-large versiyonu, değerlendirilen kodlayıcı modeller arasında en iyi performansı göstererek Portekizce NLP uygulamaları için önemli bir adım teşkil ediyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0
Yapay Zeka Modellerinin 'Bilinmeyen' Verilerle Başa Çıkma Sırrı Çözüldü
Araştırmacılar, büyük dil modellerinin alışık olmadığı verilerle karşılaştığında nasıl davrandığını anlamak için yeni bir çerçeve geliştirdi. Mevcut tespit yöntemlerinin aslında metin uzunluğundan etkilendiğini ve bu nedenle yanıltıcı sonuçlar verdiğini keşfettiler. Çalışma, modellerin iki farklı yoldan bilgiyi işlediğini ortaya koyuyor: embedding'ler metnin konusunu yakalarken, işleme yörüngesi modelin veriyi nasıl işlediğini gösteriyor. Bu bulgular, yapay zeka güvenliği ve modellerin güvenilirlik tespiti için önemli sonuçlar taşıyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0
Yapay Zeka Modellerinde Hız Rekoru: EVICT Sistemi 2 Kat Daha Hızlı İşlem Sağlıyor
Araştırmacılar, yapay zeka modellerinin metin üretim hızını artırmak için EVICT adlı yeni bir sistem geliştirdi. Bu sistem, özellikle karmaşık Mixture-of-Experts (MoE) modellerinde yaşanan performans sorunlarını çözerek, gereksiz hesaplamaları ortadan kaldırıyor. EVICT, ağaç tabanlı tahmini kod çözme tekniğini optimize ederek, sadece faydalı token'ları doğrulama sürecine dahil ediyor. Sistem herhangi bir ek eğitim gerektirmeden çalışabiliyor ve mevcut altyapılarla uyumlu. Farklı model mimarileri üzerinde yapılan testlerde sistemin 2 kata kadar hız artışı sağladığı görüldü. Bu gelişme, ChatGPT gibi büyük dil modellerinin yanıt verme hızını önemli ölçüde artırabilir.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0
Yapay Zeka Modelleri Artık Seçici Unutabilecek: TokenUnlearn Yöntemi
Araştırmacılar, büyük dil modellerinin belirli bilgileri daha hassas bir şekilde unutabilmesi için yenilikçi bir yöntem geliştirdi. TokenUnlearn adlı bu yaklaşım, tüm metin yerine yalnızca kritik kelimeleri hedef alarak modellerin istenmeyen bilgileri daha etkili şekilde silmesini sağlıyor. Mevcut yöntemler tüm metne aynı şekilde müdahale ederken, yeni sistem önemli ve önemsiz kelimeler arasında ayrım yapabiliyor. Bu gelişme, yapay zeka modellerinin gizlilik, güvenlik ve yasal düzenlemeler açısından daha uyumlu hale gelmesinde önemli bir adım olarak değerlendiriliyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0
Yapay Zeka Modellerinde Tekrar Tuzağını Çözen Yeni Yöntem Geliştirildi
Büyük dil modellerinin en önemli sorunlarından biri olan 'mod çöküşü' için yeni bir çözüm geliştirildi. Bu sorun, yapay zeka modellerinin aynı cümleleri tekrar etmesi veya yaratıcılığını kaybetmesi olarak kendini gösteriyor. Araştırmacılar, sorunu dinamik sistemler açısından ele alarak, modelin iç temsillerinin düşük boyutlu bir alana sıkışması olarak tanımladılar. Geliştirdikleri 'Güçlendirilmiş Mod Düzenleme' adlı yöntem, modelin hafıza yapısına hafif müdahaleler yaparak bu tuzaktan kaçmasını sağlıyor. Yöntem, birden fazla büyük dil modelinde test edildi ve önemli başarılar elde edildi. Bu gelişme, yapay zeka asistanlarının daha tutarlı ve yaratıcı metinler üretmesine katkı sağlayabilir.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0
Sosyal Medyada Tartışmalı Konuların Analizi İçin Yeni Yapay Zeka Benchmarkı
Araştırmacılar, sosyal medyada ideolojik ayrılıklar üzerinden yapılan tartışmaları analiz etmek için ControBench adlı yeni bir benchmark geliştirdi. Reddit'ten toplanan verilerle oluşturulan bu sistem, politik kutuplaşma ve dezenformasyon araştırmalarında önemli bir boşluğu dolduruyor. Trump, kürtaj ve din gibi tartışmalı konularda 7.370 kullanıcı, 1.783 gönderi ve 26.525 etkileşim verisi içeren benchmark, hem metin analizini hem de sosyal etkileşim yapısını bir araya getiriyor. Mevcut veri setleri ya sadece metni ya da sadece etkileşim yapısını dikkate alırken, ControBench her iki unsuru da birleştirerek tartışmaların bağlamsal analizine olanak sağlıyor. Bu gelişme, çevrimiçi platformlarda içerik moderasyonu ve polarizasyon dinamiklerini anlamak için kritik önem taşıyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0
Yapay Zeka Modellerinin İç Dünyasını Anlamak İçin Yeni Yöntem Geliştirildi
Araştırmacılar, dil modellerinin iç temsillerini daha iyi anlayabilmek için 'Kodlama Probu' adında yenilikçi bir yöntem geliştirdi. Geleneksel yaklaşımların aksine, bu teknik farklı özelliklerin model temsillerine katkısını doğrudan karşılaştırma imkanı sunuyor. Metin ve konuşma transformatör modelleri üzerinde yapılan testlerde, akustik, fonetik, sözdizimsel ve sözcüksel özellikler analiz edildi. Sonuçlar, konuşmacı kimliğinin eğitim hedeflerine göre değişkenlik gösterdiğini, sözdizimsel ve sözcüksel özelliklerin ise bağımsız olarak katkı sağladığını ortaya koydu. Bu yöntem, yapay zeka modellerinin nasıl çalıştığını anlamamıza yeni bir perspektif kazandırıyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0
Çok Turlu Sohbet Robotları için Yeni RAG Sistemi Geliştirildi
Araştırmacılar, yapay zeka sohbet robotlarının çok turlu konuşmalarda daha doğru ve güvenilir yanıtlar verebilmesi için H-RAG adlı yeni bir sistem geliştirdi. Bu sistem, hiyerarşik ebeveyn-çocuk yapısıyla bilgi arama ve üretim süreçlerini iki aşamada gerçekleştiriyor. İlk aşamada küçük metin parçacıkları arasından en uygun bilgiyi buluyor, ikinci aşamada ise bu bilgiyi tam belgeler içinde bütünlüklü bir şekilde sunuyor. Sistem, hem yoğun hem de seyrek arama tekniklerini birleştirerek hibrit bir yaklaşım benimsiyor. SemEval-2026 yarışmasında test edilen bu yöntem, sohbet robotlarının uzun konuşmalarda bağlamı kaybetmeden doğru bilgi verebilme kapasitesini artırmayı hedefliyor. Özellikle müşteri hizmetleri ve eğitim alanlarında kullanılabilecek bu teknoloji, yapay zeka destekli konuşma sistemlerinin gelişimi için önemli bir adım teşkil ediyor.
arXiv — Hesaplamalı Dilbilim (cs.CL) · 10 gün önce
0