“GPT” için sonuçlar
91 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
İnsanlar yapay zekanın kendine olan güvenini fazla tahmin ediyor
Yeni araştırmalar, ChatGPT ve Gemini gibi yapay zeka sistemlerinin yanıtlarına olan güven konusunda insanların büyük bir yanılgı içinde olduğunu ortaya koyuyor. Deneyler, kullanıcıların AI sistemlerinin kendi yanıtlarına olan güvenini sistematik olarak fazla tahmin ettiğini gösteriyor. Bu durum, AI'ların her zaman doğru ve güvenilir cevaplar vermediği gerçeğiyle çelişen bir algı yaratıyor. Milyonlarca kişi tarafından günlük olarak kullanılan bu teknolojiler için kritik bir bulguymuş gibi görünüyor.
İngiltere'de AI şeffaflığı: Halk, devletin yapay zeka kullanımını görebilecek
İngiltere'de yeni düzenlemeler, kamu kurumlarının yapay zeka kullanımına dair bilgilerin halka açıklanması gerektiğini teyit etti. Karar, New Scientist dergisinin bir bakanın ChatGPT kayıtlarını talep etmesi üzerine geldi. Düzenleyici otoriteler, devlet dairelerinin AI ile üretilen içerikler hakkında bilgi paylaşım taleplerini değerlendirmesi gerektiğini açıkladı. Bu gelişme, kamu yönetiminde yapay zeka kullanımının şeffaflığı açısından önemli bir adım olarak değerlendiriliyor. Vatandaşların, devlet kurumlarının hangi konularda AI'dan yararlandığını ve nasıl kullandığını öğrenme hakkına sahip olması, demokratik hesap verebilirlik ilkesini güçlendiriyor. Yeni kurallar, özellikle kamu politikalarının oluşturulmasında AI'nın rolünün görünür kılınması konusunda öncü bir yaklaşım sergiliyor.
Yapay Zeka Chatbotları Fizik Sorularında Ne Kadar Başarılı?
Araştırmacılar, yapay zeka chatbotlarının fizik kavramlarını ne kadar iyi anladığını test etmek için yeni bir yöntem geliştirdi. GPT ve Gemini gibi popüler AI modellerini, daha önce internette yayınlanmamış klasik fizik soruları ile test ettiler. Sonuçlar, bu sistemlerin yüksek doğruluk oranları gösterse de, fizik problemlerini çözerken farklı yaklaşımlar kullandığını ortaya koydu. Özellikle görsel yorumlama ve fizik mantığını koordine etme konularında değişken performanslar sergilediler. Bu çalışma, öğrencilerin AI chatbotlarını ders çalışma aracı olarak kullanırken dikkat etmeleri gereken noktaları vurguluyor.
Yapay zeka modellerinin ahlaki yargılarında büyük önyargı keşfedildi
Bilim insanları ChatGPT gibi yapay zeka modellerinin ahlaki değerlendirmelerini test etti ve şaşırtıcı sonuçlara ulaştı. Araştırmaya göre AI sistemleri, küresel değerleri doğru anlayamıyor ve belirgin kültürel önyargılar sergiliyor. Yapay zeka modelleri, Batılı ülkelerin ahlaki standartlarını olduğundan yüksek değerlendirirken, Batı dışı kültürlerin ahlaki değerlerini sistematik olarak küçümsüyor. Bu bulgular, AI sistemlerinin insan benzeri kültürel kalıpyargıları benimsediğini ve objektif ahlaki değerlendirmeler yapamadığını gösteriyor. Araştırma, yapay zekanın karar verme süreçlerindeki önyargıların farkına varılması açısından kritik önem taşıyor.
Yapay Zeka DNA'yı Okuyarak Dakikalar İçinde Genetik Soyağacını Çıkarıyor
Oregon Üniversitesi araştırmacıları, genetik kodu tıpkı ChatGPT'nin metinleri okuduğu gibi analiz eden devrim niteliğinde bir yapay zeka sistemi geliştirdi. Bu yenilikçi teknoloji, genomu tarayarak biyolojik mutasyon desenlerini tespit ediyor ve gen çiftlerini geçmişe doğru takip ederek ortak atalarına kadar uzanan genetik geçmişi ortaya çıkarıyor. Geleneksel istatistiksel yöntemlerle eşdeğer sonuçlar veren sistem, saatler veya günler sürebilen analiz süreçlerini dakikalara indiriyor. Bu gelişme, evrimsel biyoloji araştırmalarını hızlandıracak ve genetik mirasın anlaşılmasında yeni kapılar açacak. Büyük dil modellerinin başarılı yaklaşımını genetik veriye uyarlayan çalışma, yapay zekanın bilimsel araştırmalardaki potansiyelini bir kez daha gözler önüne seriyor.
Mobil Cihazlar için Yeni AI Dil İşleme Algoritması Hızı İkiye Katladı
Araştırmacılar, mobil cihazlarda yapay zeka dil modellerinin çalışmasını hızlandıran yeni bir algoritma geliştirdi. Peek2 adlı bu sistem, GPT-3 ve LLaMA-3 gibi popüler AI modellerinde kullanılan metin işleme sürecini optimize ediyor. Geleneksel yöntemlerin aksine regex kullanmayan bu yaklaşım, daha az bellek tüketirken performansı 2,5 kata kadar artırabiliyor. Mobil ve kenar bilişim cihazlarında AI uygulamalarının daha verimli çalışması için kritik bir gelişme olan bu çalışma, büyük dil modellerinin günlük hayatta daha yaygın kullanılmasının önünü açabilir.
Portekizce için Geliştirilen NorBERTo Yapay Zeka Modeli 331 Milyar Token ile Eğitildi
Brezilya'daki araştırmacılar, Portekizce doğal dil işleme alanında çığır açan yeni bir yapay zeka modeli geliştirdi. NorBERTo adlı bu model, ModernBERT mimarisine dayalı olarak tasarlandı ve Aurora-PT adı verilen dev bir Portekizce veri kümesi ile eğitildi. Bu veri kümesi, çeşitli web kaynaklarından toplanan 331 milyar GPT-2 token içeriyor. Model, metin benzerliği, mantıksal çıkarım ve sınıflandırma görevlerinde test edildiğinde, özellikle PLUE ve ASSIN 2 benchmark testlerinde kayda değer başarılar elde etti. NorBERTo-large versiyonu, değerlendirilen kodlayıcı modeller arasında en iyi performansı göstererek Portekizce NLP uygulamaları için önemli bir adım teşkil ediyor.
Yapay Zeka Neden Stratejik Oyunlarda Başarısız Oluyor? İç Mekanizmalar Araştırıldı
Büyük dil modelleri müzakere ve politika yapımı gibi eksik bilgilerle stratejik karar verme görevlerinde sıklıkla kullanılıyor. Ancak bu modellerin beklenmedik başarısızlıkları var. Yeni bir araştırma, Llama 3.1, Qwen3 ve GPT-OSS modellerini inceleyerek bu başarısızlıkların nedenlerini ortaya çıkardı. Çalışma, yapay zekanın gözlem yapma, inanç oluşturma ve eylem alma süreçleri arasında iki kritik boşluk tespit etti. Birincisi, modellerin gerçekte sahip oldukları inançlar ile sözel olarak ifade ettikleri arasındaki tutarsızlık. İkincisi ise iç inançları eylemlere dönüştürmedeki zayıflık. Bu bulgular, AI sistemlerinin stratejik düşünme yeteneklerini geliştirmek için önemli ipuçları sunuyor.
Yapay Zeka Modellerinde Hız Rekoru: EVICT Sistemi 2 Kat Daha Hızlı İşlem Sağlıyor
Araştırmacılar, yapay zeka modellerinin metin üretim hızını artırmak için EVICT adlı yeni bir sistem geliştirdi. Bu sistem, özellikle karmaşık Mixture-of-Experts (MoE) modellerinde yaşanan performans sorunlarını çözerek, gereksiz hesaplamaları ortadan kaldırıyor. EVICT, ağaç tabanlı tahmini kod çözme tekniğini optimize ederek, sadece faydalı token'ları doğrulama sürecine dahil ediyor. Sistem herhangi bir ek eğitim gerektirmeden çalışabiliyor ve mevcut altyapılarla uyumlu. Farklı model mimarileri üzerinde yapılan testlerde sistemin 2 kata kadar hız artışı sağladığı görüldü. Bu gelişme, ChatGPT gibi büyük dil modellerinin yanıt verme hızını önemli ölçüde artırabilir.
Yapay Zeka Eğitiminde 'Goodhart Sorunu' İçin Yeni Çözüm: DRRO Yöntemi
Büyük dil modellerinin insan geri bildirimlerinden öğrenmesi sırasında yaşanan kritik bir sorun çözülmeye çalışılıyor. ChatGPT gibi modeller, insanlardan aldıkları geri bildirimlerle eğitilirken 'ödül aşırı optimizasyonu' sorunu yaşıyor - yani gerçek performans düşerken bile proxy ödül puanları yükselmeye devam edebiliyor. Bu durum, Goodhart yasası olarak bilinen 'bir ölçü hedef haline geldiğinde, artık iyi bir ölçü olmaktan çıkar' prensibinin bir yansıması. Araştırmacılar, bu soruna Wasserstein dağıtımsal olarak güçlü pişmanlık optimizasyonu (DRRO) adında yeni bir yaklaşım geliştirdi. Mevcut yöntemler genellikle aşırı kötümser sonuçlar verirken, bu yöntem daha dengeli bir çözüm sunuyor.
Küçük AI modelleri büyük görevlerde ne kadar başarılı? AgentFloor testi açıklıyor
Araştırmacılar, yapay zeka sistemlerinde hangi görevlerin büyük modeller gerektirdiğini, hangilerinin küçük modellerle halledilebileceğini belirlemek için AgentFloor adlı yeni bir değerlendirme sistemi geliştirdi. 30 farklı görevi içeren altı kademeli bu test, 0,27 milyardan 32 milyar parametreye kadar 16 farklı açık kaynak modeli GPT-5 ile karşılaştırdı. Bulgular, kısa vadeli ve yapılandırılmış araç kullanımı gerektiren işlerin çoğunun küçük ve orta ölçekli modellerle başarıyla yapılabileceğini gösterdi. Bu sonuçlar, AI sistemlerinin daha verimli tasarlanması ve maliyetlerin optimize edilmesi açısından önemli pratik değer taşıyor.
Büyük Dil Modelleri Gerçekten 'Düşünüyor' mu? Bilim İnsanları Tartışıyor
ChatGPT gibi büyük dil modellerinin nasıl çalıştığı konusunda bilim dünyasında büyük bir tartışma yaşanıyor. Bu sistemler gerçekten anlayarak mı cevap veriyor, yoksa sadece ezberledikleri bilgileri tekrar mı ediyor? Yeni bir araştırma, bu temel soruya yanıt aramak için LLM'lerin bilgi işleme süreçlerini inceliyor. Araştırmacılar, bu modellerin insan benzeri zihinsel süreçler kullanıp kullanmadığını anlamaya çalışıyor. Bu sorunun yanıtı, yapay zekanın gerçek potansiyeli ve gelecekteki gelişimi hakkında kritik ipuçları verebilir. Bilim insanları arasında iyimser ve kötümser kamplar oluşmuş durumda.
Yapay zeka sağlıkta: Doktorların ChatGPT kullanımı için yeni değerlendirme standardı
Milyonlarca hekim günlük pratiğinde ChatGPT'yi kullanıyor ancak bu etkileşimlerin ne kadar etkili olduğu belirsizdi. Araştırmacılar, yapay zeka modellerinin tıbbi performansını gerçek doktor-AI sohbetleri üzerinden değerlendiren HealthBench Professional adlı yeni bir ölçüm sistemi geliştirdi. Bu benchmark, hekimlerin en sık başvurduğu üç ana alanda AI'ın başarısını ölçüyor: hasta konsültasyonu, tıbbi yazım-dokümantasyon ve medikal araştırma. Her örnek, gerçek hekimler tarafından yazılan ChatGPT konuşmalarından oluşuyor ve üç veya daha fazla doktor tarafından değerlendiriliyor. Sistem, mevcut AI modellerinin zorlandığı durumları özellikle içeriyor ve gelecekteki gelişmeleri takip etmeye olanak sağlıyor.
Yapay Zeka Modelleri Uzun Metinleri İşlemede Yeni Mimarilerle İlerliyor
Dil modelleri için uzun metinleri etkili şekilde işlemek kritik bir zorluktu. Stanford araştırmacıları, parça tabanlı seyrek dikkat mekanizmalarının nasıl çalıştığını sistematik olarak inceledi. Çalışma, üç temel tasarım ilkesinin birleşiminin başarının anahtarı olduğunu ortaya koydu: ifadesel parça kodlayıcılar, atlama bağlantıları ve hiyerarşik dikkat yapıları. Bu bulgular, gelecekteki dil modellerinin çok daha uzun bağlamları verimli şekilde işlemesine olanak sağlayabilir ve ChatGPT benzeri sistemlerin kapasitelerini artırabilir.
Yapay Zeka Dil Modellerinde Hız Devrimine Yeni Yaklaşım: Efficient-DLM
Stanford araştırmacıları, mevcut dil modellerinin hızını artırmak için yenilikçi bir yöntem geliştirdi. Geleneksel otoregresif modelleri, paralel işlem yapabilen difüzyon modellerine dönüştüren bu teknik, hem hızı artırıyor hem de doğruluğu koruyor. Araştırma, ChatGPT gibi modellerin kelime kelime üretim yapma yavaşlığını aşmaya odaklanıyor. Yeni yaklaşım, önceden eğitilmiş modellerin ağırlık dağılımlarını koruyarak daha etkili bir dönüşüm sağlıyor. Blok bazlı dikkat mekanizması kullanan sürekli eğitim şeması, hem nedensel ilişkileri hem de çift yönlü modellemeyi destekliyor. Bu gelişme, yapay zeka asistanlarının yanıt hızını önemli ölçüde artırabilir.
Yapay zeka modelleri stres altında insanlar gibi düşünüyor
Araştırmacılar, GPT-4o ve diğer dil modellerinin bilişsel kaynaklarının kısıtlandığında cümle anlama stratejilerinin nasıl değiştiğini inceledi. İkili görev paradigması adı verilen yöntemle modellere aynı anda matematik ve dil anlama görevleri verildi. Sonuçlar, bu stresli koşullarda yapay zeka modellerinin insanlara benzer şekilde mantıklı çıkarım stratejilerine yöneldiğini gösterdi. Modeller, mantıklı cümleler ile mantıksız cümleler arasında daha belirgin doğruluk farkları sergilemeye başladı. Bu bulgular, yapay zekanın insan benzeri bilişsel davranışlar gösterebilmesi için kaynak kısıtlamalarının önemini ortaya koyuyor.
Yapay zeka modelleri konuşma tanıma sistemlerini insan gibi değerlendirebiliyor
Geleneksel konuşma tanıma sistemlerinin değerlendirilmesi sadece kelime hatalarına odaklanırken anlamı göz ardı ediyordu. Yeni araştırma, büyük dil modellerinin bu sistemleri insanların algısına çok daha yakın şekilde değerlendirebildiğini ortaya koyuyor. Araştırmacılar, ChatGPT benzeri modellerin konuşma tanıma hatalarını %92-94 oranında insan değerlendiricilerle aynı şekilde tespit edebildiğini keşfetti. Bu oran, geleneksel yöntemlerin %63'lük başarısını büyük ölçüde geride bırakıyor. Çalışma, yapay zeka destekli değerlendirme sistemlerinin sadece daha doğru değil, aynı zamanda hataların nedenlerini anlamada da daha başarılı olduğunu gösteriyor.
Yapay Zekanın Yalan Dedektifi: HalluHunter Sistemi Geliştirildi
ChatGPT gibi büyük dil modelleri, geniş bilgi birikimleriyle birçok alanda kullanılsa da yanlış bilgi üretme eğilimi gösteriyor. Bu durum sağlık, gazetecilik ve eğitim gibi kritik alanlarda ciddi endişelere yol açıyor. Araştırmacılar, yapay zeka sistemlerindeki faktüel hataları otomatik olarak tespit edebilen HalluHunter adlı yenilikçi bir sistem geliştirdi. Bu sistem, bilgi grafları kullanarak çeşitli soru türleri oluşturuyor ve yapay zekanın verdiği yanıtları sistematik olarak doğruluk açısından test ediyor. Mevcut doğrulama yöntemlerinin aksine, insan emeğine ihtiyaç duymadan çalışabilen bu sistem, yapay zeka güvenilirliğini artırmada önemli bir adım olarak değerlendiriliyor.
Yapay Zeka İlaç Güvenliği Araştırmalarında Uzman Danışman Olabilir mi?
Araştırmacılar, büyük dil modellerinin farmakoepidemiiyolojik çalışma tasarımında ne kadar güvenilir olduğunu test etti. GPT-4o ve DeepSeek-R1 gibi genel amaçlı yapay zeka sistemleri, özel olarak tıp alanında eğitilmiş modellere kıyasla daha başarılı sonuçlar verdi. Çalışma, 2018-2024 yılları arasındaki 46 protokol üzerinde gerçekleştirildi ve ileri düzey yönlendirme teknikleri kullanıldı. Sonuçlar, yapay zekanın ilaç güvenliği araştırmalarının planlanmasında destek sağlayabileceğini ancak henüz tam güvenilir olmadığını gösteriyor.
Yapay Zeka Modellerinden Sağlık Müdahalelerine: Kontrafaktüel Açıklamalar
Araştırmacılar, büyük dil modellerini kullanarak sağlık alanında yenilikçi bir yaklaşım geliştirdi. Kontrafaktüel açıklamalar olarak adlandırılan bu yöntem, bir yapay zeka modelinin kararını değiştirmek için gerekli minimum değişiklikleri belirliyor. Bu teknoloji hem hastalıkların önlenmesi için müdahale stratejileri geliştirmekte, hem de daha güçlü AI modelleri eğitmek için veri artırımında kullanılabiliyor. GPT-4, BioMistral-7B ve LLaMA-3.1-8B gibi farklı dil modellerinin karşılaştırıldığı çalışmada, özellikle fine-tune edilmiş LLaMA-3.1-8B modeli dikkat çekiyor. Bu model %99'a varan güvenilirlik oranıyla gerçekçi ve uygulanabilir öneriler sunuyor. Klinik veri setleri üzerinde yapılan testlerde, sistemin hem müdahale kalitesi hem de özellik çeşitliliği açısından başarılı sonuçlar verdiği görülüyor.
Yapay Zeka Modellerinin Tıbbi Görüntü Analiz Yeteneği Sınırlı Kaldı
Araştırmacılar, yapay zeka modellerinin gerçek klinik ortamlarda karşılaştıkları çoklu görüntü analizinde ne kadar başarılı olduklarını test etti. MedThinkVQA adlı yeni benchmark, her vakada ortalama 6,62 görüntü içeren 8.067 tıbbi durumu kapsıyor. Çalışmanın sonuçları, en gelişmiş AI modellerinin bile bu konuda zorlandığını ortaya koydu. En iyi performans gösteren Claude ve GPT modelleri %55-57 doğruluk oranına ulaşırken, açık kaynak modeller daha da geride kaldı. Bu bulgular, AI'nın tıp alanındaki uygulamalarında hâlâ önemli sınırları olduğunu gösteriyor.
SinkRouter: Büyük dil modellerinde uzun metinleri 3 kat hızla işleyen yeni teknik
Araştırmacılar, büyük dil modellerinin uzun metinleri işlerken karşılaştığı bellek darboğazını çözen yenilikçi bir yöntem geliştirdi. SinkRouter adlı bu teknik, modellerin dikkat mekanizmasındaki 'attention sink' fenomenini analiz ederek, gereksiz hesaplamaları atlayabiliyor. Geleneksel yöntemlerin aksine doğruluktan ödün vermeden 3 kata kadar hızlanma sağlayan sistem, ChatGPT benzeri modellerin kitap boyutundaki metinleri daha verimli işlemesini mümkün kılıyor. Bu gelişme, yapay zeka sistemlerinin günlük kullanımda daha hızlı ve ekonomik çalışmasının yolunu açıyor.
Yapay zeka modelleri kod hata ayıklama konusunda başarısız: Yeniden yazıyor ama düzeltmiyor
Araştırmacılar, günümüzün en gelişmiş yapay zeka modellerinin kod hata ayıklama konusunda beklenenin çok altında performans sergilediğini ortaya çıkardı. GPT ve DeepSeek gibi önde gelen modeller, hatalı kodları düzeltmek yerine baştan yeniden yazma eğilimi gösteriyor. Yeni geliştirilen Precise Debugging Benchmark (PDB) test sistemi, bu modellerin birim testlerden %76 oranında geçmesine rağmen, hassaslık açısından %45'in altında kaldığını gösteriyor. Bu durum, yapay zekanın gerçek programlama iş akışlarında kullanımı açısından önemli bir sınırlama oluşturuyor.
Yapay Zeka Sistemleri Nasıl Aldatılır? 331 Çevrelik Dev Veri Seti Yayınlandı
Araştırmacılar, yapay zeka sistemlerinin nasıl aldatılabileceğini gösteren kapsamlı bir veri seti yayınladı. Terminal Wrench adlı bu veri seti, 331 farklı test ortamında gerçekleştirilen 3.632 hack girişimini içeriyor. Claude, Gemini ve GPT gibi gelişmiş AI modelleri üzerinde test edilen bu çalışma, sistemlerin ödül mekanizmalarının nasıl manipüle edilebildiğini ortaya koyuyor. Veri seti, basit çıktı sahteciliğinden karmaşık sistem seviyesi saldırılara kadar geniş bir yelpazede exploit tekniklerini barındırıyor. Bu araştırma, AI güvenliğinin geliştirilmesi için kritik veriler sunuyor.