...
"program doğrulama" için 173 sonuç bulundu
× Aramayı temizle
Arama Sonuçları
173 haber
Teknoloji & Yapay Zeka
Yapay zeka ve insan işbirliğiyle dil modellerini eğiten yeni yaklaşım geliştirildi
Araştırmacılar, büyük dil modellerinin eğitiminde insan ve yapay zeka işbirliğini birleştiren CoAct adlı yeni bir yaklaşım geliştirdi. Mevcut yöntemler ya tamamen yapay zeka etiketlemesine dayanan ama güvenilirlik sorunu yaşayan kendini ödüllendirme, ya da kaliteli ama pahalı insan denetimi gerektiren aktif öğrenme kullanıyor. CoAct ise stratejik insan-AI işbirliği ile bu iki yaklaşımı birleştirerek her ikisinin avantajlarından yararlanıyor. Sistem, güvenilir kendi etiketlediği verileri ve insan doğrulaması gereken örnekleri belirlemek için kendi tutarlılığını kullanıyor. Ayrıca insan geri bildirimleri, modelin kendi çözebileceği kapasitedeki yeni talimatlar üretmesine rehberlik ediyor. Üç farklı akıl yürütme testinde değerlendirilen CoAct, ortalama %13 iyileşme sağladı. Bu yaklaşım, yüksek kaliteli insan etiketli verinin maliyetli ve kıt olduğu sorununa çözüm getiriyor.
Fizik
Kuantum sistemlerde doğrulama işlemini hızlandıran yeni yöntem geliştirildi
Araştırmacılar, kuantum simülatörlerin istenen durumları gerçekten üretip üretmediğini doğrulamak için yeni bir yöntem geliştirdi. Matrix Product States (MPS) olarak bilinen tek boyutlu kuantum sistemlerin hazırlanması konusunda önemli ilerlemeler kaydedilmişken, bu sistemlerin doğrulanması hala zorlu bir problem olarak kalıyordu. Yeni yaklaşım, Direct Fidelity Estimation yönteminin klasik hesaplama yükünü dramatik şekilde azaltıyor. Geleneksel yöntemler üstel karmaşıklık gerektirirken, yeni otoregresif örnekleme tekniği bu yükü kubit sayısıyla doğrusal olarak ölçeklendiriyor. Bu gelişme, yakın gelecekte kuantum simülatörlerin ve varyasyonel algoritmaların pratik uygulamalarında önemli bir adım teşkil ediyor.
Teknoloji & Yapay Zeka
ZoFia: Yapay Zeka ile Sahte Haberleri Sıfır Örnekle Tespit Eden Yeni Sistem
Araştırmacılar, büyük dil modellerinin sahte haber tespitindeki sınırlarını aşmak için ZoFia adlı yenilikçi bir sistem geliştirdi. Sosyal medyada hızla yayılan yanlış bilgilerin toplumsal güveni sarstığı günümüzde, bu iki aşamalı framework önemli bir çözüm sunuyor. Sistem, önce haber metinlerinden önemli varlıkları çıkarıp çift kaynaklı doğrulama yapıyor, sonra da çoklu yapay zeka ajanları farklı perspektiflerden analiz gerçekleştiriyor. ZoFia'nın en önemli yeniliği, tek bir AI modelinin düşebileceği önyargı tuzaklarından kaçınarak, hem içerik analizi hem de gerçek kontrol süreçlerini eş zamanlı yürütebilmesi. Bu yaklaşım, özellikle güncel olaylarla ilgili haberlerde yapay zekanın bilgi kesintisi ve yanılsama sorunlarını çözmeyi hedefliyor. Geliştirilen hiyerarşik önemlilik algoritması, sahte haberlerin tespitinde yüksek doğruluk oranları vaat ediyor.
Teknoloji & Yapay Zeka
Dijital İçerik Doğrulamada Çelişki Sorunu: AI ve İnsan Yapımı Sinyalleri Çakışıyor
Araştırmacılar, dijital içerik doğrulama sistemlerinde ciddi bir güvenlik açığı keşfetti. C2PA standardı ve görünmez filigran teknolojisi gibi iki farklı doğrulama katmanının teknik olarak bağımsız çalışması, aynı dijital varlığın hem insan yapımı hem de AI üretimi olarak geçerli şekilde işaretlenmesine olanak tanıyor. 'Bütünlük Çakışması' adı verilen bu durumda, bir görsel dosya kriptografik olarak geçerli C2PA manifesti ile insan yapımı olduğunu iddia ederken, aynı zamanda piksellerinde AI üretimi olduğunu gösteren filigran taşıyabiliyor. Bu çelişkili durumun, standart düzenleme araçlarıyla herhangi bir kriptografik güvenlik ihlali yapmadan mümkün olduğu kanıtlandı.
Teknoloji & Yapay Zeka
Yapay Zeka Destekli Test Sistemi Yazılım Güvenliğini Artırıyor
Araştırmacılar, yazılım kütüphanelerinin güvenlik testlerini otomatikleştiren yeni bir sistem geliştirdi. MASFuzzer adı verilen bu framework, büyük dil modellerini kullanarak yazılımlardaki potansiyel güvenlik açıklarını daha etkili şekilde tespit ediyor. Geleneksel yöntemlerde geliştiricilerin manuel olarak hazırladığı test sürücüleri yerine, sistem otomatik olarak çok boyutlu API dizileri oluşturuyor ve adaptatif planlama stratejileri kullanıyor. Bu yaklaşım, yazılımların derin program dallarına ulaşarak daha kapsamlı testler yapılmasını sağlıyor. Yazılım güvenliğinin kritik önem taşıdığı günümüzde, bu tür otomatik test sistemleri siber güvenlik açıklarının önceden tespit edilmesinde önemli rol oynuyor.
Fizik
Kuantum Işınlamada 'Düşman Modeli': Hilekarlara Karşı Yeni Doğrulama Yöntemi
Araştırmacılar, kuantum ışınlama deneylerinin başarısını ölçmek için yeni bir yaklaşım geliştirdi. Geleneksel olarak sadece 'fidelity' (sadakat) değeriyle ölçülen kuantum ışınlama başarısı, artık potansiyel hilekarlara karşı tasarlanmış 'düşman modelleri' ile test ediliyor. Bu yaklaşım, daha önce belirlenen 1/2 ve 2/3 sadakat eşiklerinin matematiksel temellerini açıklıyor ve kuantum ışınlamanın gerçekten başarılı olup olmadığını daha güvenilir şekilde belirlemeye yardımcı oluyor. Çalışma, kuantum bilgi teknolojilerinin güvenilirliğini artırmak için kritik öneme sahip.
Teknoloji & Yapay Zeka
Yapay Zeka Destekli Geliştirme Araçları İçin Yeni Gözlem Sistemi
Yazılım geliştiriciler yapay zeka destekli araçları kullanırken maliyet, kalite ve performans konularında zorluklarla karşılaşıyor. Araştırmacılar, bu sorunları çözmek için geliştirici verimliliği araçlarına yönelik kapsamlı bir yapay zeka gözlenebilirlik sistemi geliştirdi. Sistem, gerçek zamanlı token takibi, 24 farklı model için fiyat kayıtları, yanıt doğrulama ve maliyet analitiklerini tek bir kontrol panelinde birleştiriyor. Workstream adlı geliştirici verimliliği panosu ile yapay zeka gözlem özetleyicisini harmanlayan bu yaklaşım, pull request'ler, Jira görevleri ve yapay zeka kod incelemelerini merkezi bir konumda topluyor. Çalışma, yazılım geliştirme süreçlerinde yapay zeka kullanımının daha şeffaf ve verimli hale getirilmesi için önemli bir adım oluşturuyor.
Teknoloji & Yapay Zeka
Makine Öğrenmesinde Kernel Seçimi için Yeni Yöntem Geliştirildi
Araştırmacılar, spektral yöntemlerde kritik öneme sahip olan kernel seçimi problemine yenilikçi bir çözüm getirdi. Kernelized Diffusion Maps (KDM) yönteminde doğru kernel seçimi, algoritmanın başarısını doğrudan etkiliyor. Yeni geliştirilen adaptif kernel seçim yaklaşımları, hem sürekli kernel parametrelerini öğrenen varyasyonel bir döngü, hem de özellik ailelerini seçen denetimsiz çapraz doğrulama sistemi içeriyor. Bu çalışma, veri analizinde kullanılan spektral yöntemlerin performansını artırarak makine öğrenmesi alanında önemli bir ilerleme sağlıyor.
Tıp & Sağlık
Yapay Zeka Tıpta Yalan Kaynak Gösteriyor: Yeni Sistem Sorunu Çözebilir
Araştırmacılar, gelişmiş yapay zeka modellerinin tıbbi konularda doğru bilgi üretmesine rağmen, sahte kaynaklar gösterdiğini keşfetti. Bu duruma 'Provenance Gap' (Kaynak Açığı) adını veren bilim insanları, nadir kas hastalıklarıyla ilgili testlerde en iyi AI modelinin bile yalnızca %15,3 oranında doğru bilimsel kaynak gösterebildiğini buldu. Çoğu zaman modeller gerçek ancak konuyla alakasız yayınlara atıfta bulunuyor. Bu kritik sorunu çözmek için geliştirilen HEG-TKG sistemi, 4.512 PubMed kaydından oluşturulmuş bilgi ağlarını kullanarak %100 doğrulanabilir kanıt sağlıyor.
Matematik
Presburger Aritmetiğinde Doğrusal Sıralamalar Üzerine Yeni Matematiksel Keşif
Matematikçiler, Presburger aritmetiği olarak bilinen özel bir sayısal sistem içinde tanımlanabilen doğrusal sıralamaları karakterize etmeyi başardı. Bu çalışma, tamsayılar üzerinde toplama işlemini içeren matematiksel yapılarda hangi sıralama türlerinin mümkün olduğunu kesin olarak belirledi. Presburger aritmetiği, bilgisayar biliminde özellikle program doğrulama ve otomatik ispat sistemlerinde kritik rol oynar. Araştırma, bu alandaki uzun süredir açık olan sorulara yanıt vererek, hem teorik matematik hem de uygulamalı bilgisayar bilimleri için önemli sonuçlar ortaya koyuyor. Bulgular, matematiksel mantık ve hesaplama teorisi alanlarında yeni araştırma yönlerinin açılmasına katkı sağlayacak.
Teknoloji & Yapay Zeka
Büyük Dil Modelleri Gerçek Dünya Kodlarını Analiz Etmekte Ne Kadar Başarılı?
Araştırmacılar, yapay zeka sistemlerinin matematik problemlerindeki başarısının gerçek yazılım kodlarını anlama yetisini gösterip göstermediğini test etmek için yeni bir değerlendirme sistemi geliştirdi. Amazon'un kripto kütüphanesi s2n-bignum'dan türetilen bu test, büyük dil modellerinin endüstriyel seviyedeki assembly kodlarını ne kadar iyi analiz edebildiğini ölçüyor. Sistem, matematiksel teoremler yerine gerçek dünyada kullanılan karmaşık yazılımları temel alıyor ve AI'ın pratik programlama görevlerindeki gerçek performansını ortaya çıkarıyor.