“GPT-4o” için sonuçlar

Yapay Zeka İlaç Güvenliği Araştırmalarında Uzman Danışman Olabilir mi?

Araştırmacılar, büyük dil modellerinin farmakoepidemiiyolojik çalışma tasarımında ne kadar güvenilir olduğunu test etti. GPT-4o ve DeepSeek-R1 gibi genel amaçlı yapay zeka sistemleri, özel olarak tıp alanında eğitilmiş modellere kıyasla daha başarılı sonuçlar verdi. Çalışma, 2018-2024 yılları arasındaki 46 protokol üzerinde gerçekleştirildi ve ileri düzey yönlendirme teknikleri kullanıldı. Sonuçlar, yapay zekanın ilaç güvenliği araştırmalarının planlanmasında destek sağlayabileceğini ancak henüz tam güvenilir olmadığını gösteriyor.

Yapay Zeka Telefonları Ekran Görüntüsüne Bakmadan da Kullanabilir mi?

Araştırmacılar, büyük dil modellerinin akıllı telefon uygulamalarını ne kadar iyi otomatize edebildiğini test etmek için DailyDroid adlı bir değerlendirme sistemi geliştirdi. 25 farklı Android uygulamasında 75 görevin test edildiği çalışmada, yapay zekanın sadece metin bilgisiyle mi yoksa ekran görüntüleriyle birlikte mi daha başarılı olduğu araştırıldı. GPT-4o ve GPT-4o mini modelleriyle yapılan testlerde, görsel bilginin sadece marginal bir avantaj sağladığı ortaya çıktı. Bu bulgular, yapay zeka asistanlarının telefon kullanımındaki sınırlarını ve gelişim alanlarını gösteriyor.

Yapay Zeka Artık İroniyi Anlayabiliyor: Konuşmadaki Sarkastik Tonu Yakalama

MIT ve Stanford araştırmacıları, yapay zekanın konuşmadaki ince ironi ve sarkastik tonu tespit edebilmesi için yeni bir yöntem geliştirdi. GPT-4o ve LLaMA 3 modellerini kullanan sistem, sadece ses verisiyle %73.63 doğruluk oranında sarkastik konuşmayı tanımlayabiliyor. Araştırmacılar, podcast kayıtlarından oluşturdukları PodSarc veri setiyle bu başarıyı elde etti. Bu gelişme, özellikle sosyal medya moderasyonu, müşteri hizmetleri ve eğitim teknolojilerinde devrim yaratabilir. Geleneksel yöntemler video ve metin gibi çoklu veri kaynağına ihtiyaç duyarken, yeni sistem sadece ses dosyalarıyla çalışabiliyor.

Yapay zeka modelleri hedefli mesajlarda demografik önyargı gösteriyor

Araştırmacılar, büyük dil modellerinin kişiselleştirilmiş mesajlar üretirken demografik önyargılar sergilediğini ortaya çıkardı. GPT-4o, Llama-3.3 ve Mistral-Large gibi önde gelen modellerin iklim konularında hedefli mesajlar oluşturma davranışları incelendiğinde, yaş ve cinsiyet temelli asimetriler tespit edildi. Erkeklere ve gençlere yönelik mesajların daha iddialı ve kararlı bir dil kullandığı, kadınlara ve yaşlılara yönelik mesajların ise farklı iknaci çerçeveler benimsediği gözlemlendi. Bu durum, yapay zekanın otomatik iletişimde adalet ve önyargı konularında yeni sorular ortaya çıkarıyor. Çalışma, demografik koşullu hedefli mesajlaşmada YZ davranışlarının ilk sistematik analizini sunarak, teknolojinin toplumsal önyargıları nasıl yansıtabileceğine dair önemli bulgular sağlıyor.

20 Apr

Yapay Zeka Artık Trafik Kazası Diyagramları Çizebiliyor

Araştırmacılar, polis kaza raporlarından otomatik olarak trafik kazası diyagramları oluşturabilen yapay zeka sistemleri geliştirdi. Görsel-dil modelleri kullanılan çalışmada, özellikle karmaşık kavşak türleri olan çok şeritli dönel kavşaklardaki kazalar test edildi. GPT-4o, Gemini ve Janus modellerinin karşılaştırıldığı araştırmada, yapay zekanın metinsel kaza raporlarını analiz ederek doğru ve anlaşılır görsel diyagramlar üretebileceği kanıtlandı. Bu teknoloji, şu anda manuel olarak hazırlanan ve zaman alıcı olan kaza diyagramı süreçlerini hızlandırabilir. Trafik güvenliği analizlerinde kritik rol oynayan bu diyagramların otomatik üretimi, hem insan hatasını azaltacak hem de ulaştırma güvenliği çalışmalarını daha verimli hale getirecek.

20 Apr

Yapay Zeka Vietnamca Hukuk Metinlerini Ne Kadar İyi Anlıyor?

Vietnam'ın karmaşık yasal metinleri, vatandaşların adalete erişiminde büyük bir engel oluşturuyor. Araştırmacılar, büyük dil modellerinin bu metinleri sadeleştirme yeteneklerini kapsamlı bir şekilde test etti. GPT-4o, Claude 3 Opus, Gemini 1.5 Pro ve Grok-1 modellerinin performansı, doğruluk, okunabilirlik ve tutarlılık açısından değerlendirildi. 60 karmaşık Vietnamca hukuki makale üzerinde yapılan büyük ölçekli hata analizi, modeller arasında önemli bir ödünleşim ortaya çıkardı: bazı modeller okunabilirlik konusunda başarılı olurken hukuki doğruluktan taviz veriyor. Bu çalışma, yapay zekanın hukuki metinleri halka daha erişilebilir hale getirme potansiyelini ortaya koyarken, mevcut sınırları da gözler önüne seriyor.

20 Apr

İnsanlar yapay zeka tavsiyelerini kolayca takip ediyor ama fayda görmüyor

Araştırmacılar, insanların yapay zeka chatbotlarından aldıkları kişisel tavsiyeleri ne ölçüde takip ettiğini ve bunun refah düzeylerine etkisini inceledi. 6.474 kişiyle yapılan kapsamlı çalışmada, katılımcıların %79'unun GPT-4o, LLama ve Gemini gibi AI sistemlerinden aldıkları sağlık, kariyer ve ilişki tavsiyelerini uyguladığı görüldü. Yüksek riskli önerilerde bile takip oranı %60'ın üzerinde kaldı. Bu durum, insanların AI tavsiyelerine güvenirken potansiyel sonuçları yeterince değerlendirmediğini gösteriyor. AI'ların verdiği tavsiyeler güvenlik standartlarını karşılasa da, 2-3 hafta sonraki takipte katılımcıların refah düzeylerinde kalıcı bir iyileşme gözlenmedi. Çalışma, AI danışmanlığının popülerliği ile etkinliği arasındaki boşluğu ortaya koyuyor.