“kod üretimi” için sonuçlar
34 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
RunAgent: Doğal Dil Planlarını Anlayabilen Yeni Yapay Zeka Sistemi
Araştırmacılar, büyük dil modellerinin yapılandırılmış görevleri güvenilir şekilde yerine getirememesi sorununa çözüm ürettiler. RunAgent adlı yeni platform, doğal dilde yazılan planları anlayıp adım adım uygulayabiliyor. Sistem, insan benzeri problem çözme yaklaşımını taklit ederken, programlama dillerinin deterministik yapısını koruyor. RunAgent, IF, GOTO ve FORALL gibi kontrol yapılarıyla donatılmış agentic bir dil kullanarak, doğal dilin ifade gücünü programlamanın kesinliğiyle birleştiriyor. Platform, her adımda otomatik olarak kısıtlamalar türetip doğrulama yapıyor, LLM tabanlı akıl yürütme, araç kullanımı ve kod üretimi arasında dinamik seçim yapabiliyor. Hata düzeltme mekanizmalarıyla desteklenen sistem, yapay zekanın karmaşık iş akışlarını güvenilir şekilde yürütebilmesi için önemli bir adım sayılıyor.
Yapay Zeka Artık SQL Sorgularını Daha Güvenilir Yazabiliyor
Büyük dil modelleri, doğal dilde sorulan soruları SQL veritabanı sorgularına çevirebiliyor ancak karmaşık durumlarda hata yapabiliyor. Araştırmacılar, geçmiş sorgu örneklerinden şablon oluşturan TeCoD sistemini geliştirdi. Bu sistem, benzer soruları tanıyıp önceden test edilmiş şablonları kullanarak %36 daha yüksek başarı oranı elde ediyor. Özellikle tekrar eden sorular için güvenilir yanıtlar üretiyor ve geçersiz SQL kodları oluşturma riskini minimize ediyor. Sistem, şablon seçimi ve dilbilgisi kısıtlamalı kod üretimi olmak üzere iki ana bileşenden oluşuyor.
Yapay Zeka Modellerinde 'Görev Odaklı Nöronlar' Keşfedildi
Araştırmacılar, büyük dil modellerinde bazı nöronların belirli görevler için kritik önem taşıdığını ortaya çıkardı. Matematiksel akıl yürütme ve kod üretimi konularında uzmanlaşmış modeller üzerinde yapılan sistematik budama çalışması, nöronların görev performansına eşit katkı sağlamadığını gösterdi. Aktivasyon tabanlı seçici budama yöntemi rastgele budamadan daha başarılı sonuçlar verirken, görev odaklı kritik nöronların sadece %10'unun çıkarılması modelin tamamen çökmesine neden oldu. Bu bulgular, yapay zeka modellerinin iç yapısını anlama ve optimize etme konusunda önemli ipuçları sunuyor.
Diffüzyon dil modellerinin kod üretiminde hızlı geri adım atabilme yeteneği
Yapay zeka araştırmacıları, kod üretimi gibi katı kurallara bağlı görevlerde diffüzyon dil modellerinin karşılaştığı temel sorunu çözen yeni bir yöntem geliştirdi. Saber adı verilen bu yaklaşım, modelin hatalı tahminlerini tespit edip geri alabilmesini sağlıyor. Geleneksel autoregresif modellerin aksine, diffüzyon modelleri paralel üretim ve çift yönlü bağlam anlama avantajları sunuyor. Ancak kod yazma gibi yapısal kısıtlamaların olduğu alanlarda hız ve kalite arasında kritik bir ödünleşim yaşanıyordu. Araştırmacılar, bu sorunun iki temel nedeni olduğunu keşfetti: üretim zorluğunun tüm adımlarda eşit olmaması ve erken yapılan yüksek güvenli tahminlerin geri alınamaz hatalara dönüşmesi. Yeni yöntem, adaptif hızlandırma ve akıllı geri adım mekanizmaları kullanarak bu sorunları çözüyor.
RECURSUM: Yapay Zeka Destekli Kod Üretimi Uzman Programcıları Geride Bıraktı
Bilim insanları, matematiksel tekrarlama ilişkileri için otomatik kod üreten RECURSUM adlı yeni bir sistem geliştirdi. Python tabanlı bu araç, uzman programcıların elle yazdığı kodlardan 9,8 kat daha hızlı çalışan C++ kodları üretebiliyor. Sistem, özellikle ortogonal polinomlar, özel fonksiyonlar ve sayısal entegrasyon gibi alanlarda kullanılan karmaşık matematiksel hesaplamalarda devrim yaratıyor. Sadece 10-30 satır Python kodu ile 650'den fazla satır profesyonel C++ kodu üreten sistem, üç farklı optimizasyon yöntemi kullanıyor. Bu başarı, yapay zeka destekli kod üretiminin artık insan uzmanlığını aşabildiğini gösteren önemli bir kilometre taşı olarak değerlendiriliyor.
HELIX: Robot sistemleri için güvenli kod üretim teknolojisi geliştirildi
Araştırmacılar, siber-fiziksel kontrol sistemleri için HELIX adlı yeni bir kod üretim sistemi geliştirdi. Bu sistem, matematiksel formüllerden başlayarak robot sistemleri gibi kritik uygulamalar için hem yüksek performanslı hem de güvenilir kod üretebiliyor. HELIX'in en önemli özelliği, ürettiği kodun doğruluğunu matematiksel olarak garanti edebilmesi. Sistem, yüksek seviyeli matematiksel tanımlamalardan başlayarak, bir dizi cebirsel dönüşüm uygular ve sonunda verimli bir kod haline getirir. Bu süreçte anlam bütünlüğü korunarak, orijinal formülasyondan son koda kadar her adım doğrulanır. Özellikle paralel işleme optimize edilmiş vektör ve matris hesaplamaları için geliştirilmiş bu teknoloji, kritik güvenlik gerektiren robotik uygulamalarda önemli bir ilerleme sağlıyor.
Yapay Zeka Artık Kendi Simülasyonlarını Yaratabiliyor: SOCIA-EVO Sistemi
Araştırmacılar, yapay zekanın otomatik olarak simülasyon programları oluşturabileceği yeni bir sistem geliştirdi. SOCIA-EVO adlı bu framework, geleneksel kod üretiminin ötesine geçerek gerçek verilere istatistiksel olarak uygun simülasyonlar yaratıyor. Sistem, uzun vadeli AI ajanlarının karşılaştığı bağlamsal sapma ve optimizasyon kararsızlığı sorunlarını çözmek için çift katmanlı evrimsel bir yaklaşım benimsiyor. Bayesyen ağırlıklı geri çağırma sistemi sayesinde etkisiz stratejileri ayıklayarak, gözlemsel verilerle tutarlı sonuçlar üretiyor.
Yapay Zeka Kodlarında 'Sessiz Hata' Sorunu: Yeni Denetim Sistemi Geliştirildi
Araştırmacılar, yapay zeka destekli kod üretiminde yaygın bir sorun tespit etti: AI'ın yazdığı kodlar görünürde çalışırken aslında sessizce başarısız oluyor. Stanford ve Google araştırmacıları, bu durumun rastgele bir hata dağılımı olmadığını, insan geri bildirimlerinden kaynaklanan sistematik bir sorun olabileceğini öne sürüyor. Geliştirilen AIRA sistemi, 15 farklı kontrol mekanizmasıyla kodlardaki bu gizli hataları tespit edebiliyor. Üç farklı çalışmada test edilen sistem, AI kodlarının insan yazdığı kodlara göre daha fazla 'aldatıcı hata' içerdiğini ortaya koydu.
Yapay Zeka Farklı Programlama Dillerini Birbirine Çevirebiliyor mu?
Araştırmacılar, büyük dil modellerinin farklı programlama dilleri arasında kod üretme yeteneklerini kapsamlı bir şekilde incelediler. 13 farklı programlama dilini kapsayan ve yaklaşık 14 bin örnek içeren bir veri seti kullanarak gerçekleştirilen çalışma, yapay zekanın programlama dillerini birbirine çevirme konusundaki başarısının düşündüğümüzden daha karmaşık olduğunu ortaya koyuyor. Çalışma, özellikle modern yazılım geliştirmede sıkça karşılaşılan kod taşıma ve yeniden kullanma süreçlerinde yapay zeka destekli çözümlerin ne kadar etkili olabileceğine dair önemli bulgular sunuyor.
Yapay Zeka Kod Üretiminde Gizli Güvenlik Açığı Riski
Araştırmacılar, büyük dil modellerinin kod yazma sürecinde ortaya çıkan yeni bir sorunu tanımladı: Yanlış Güvenlik Güveni (FSC). Bu durum, AI sistemlerinin işlevsel olarak doğru görünen ancak güvenlik açıkları barındıran kodlar üretmesi anlamına geliyor. Çalışma, herhangi bir saldırı girişimi olmaksızın bile bu tür güvenlik açıklarının ne sıklıkta ortaya çıktığını ölçmeyi amaçlıyor. Geleneksel işlevsellik testlerinin bu gizli güvenlik sorunlarını tespit etmede yetersiz kalabileceği vurgulanıyor. Bu bulgular, AI destekli kod geliştirme süreçlerinde daha kapsamlı güvenlik değerlendirme yöntemlerinin gerekliliğini ortaya koyuyor.
Yapay Zeka Metin Üretiminde Yeni Kararlılık Tabanlı Çözüm
Araştırmacılar, paralel metin üretimi yapan difüzyon dil modellerinin performansını artıran yeni bir yöntem geliştirdi. Stability-Weighted Decoding (SWD) adlı bu teknik, modellerin metin üretim sürecinde hangi kelimelerin güvenli şekilde ortaya çıkarılabileceğini daha doğru belirliyor. Geleneksel yöntemler tek bir andaki güven puanlarına dayanırken, SWD kelimelerin zaman içindeki kararlılığını da hesaba katıyor. Bu yaklaşım, kelimelerin temporal kararsızlığının, maskelenmiş bağlamla olan karşılıklı bilgisine katı bir alt sınır sağladığını teorik olarak kanıtlıyor. Sonuç olarak kararsız kelimeler için erken maskesini kaldırma riskini azaltıyor ve kod üretimi gibi uygulamalarda daha kaliteli sonuçlar elde ediliyor.
Yapay Zeka Kod Üretiminde Uzman Yönlendirme Kalıpları Keşfedildi
Araştırmacılar, yapay zeka modellerinin kod üretimi sırasında nasıl çalıştığını daha iyi anlamak için Qwen3.5-35B modelini incelediler. Mixture-of-Experts (MoE) mimarisine sahip bu model, aynı başlangıç kodundan farklı kod örnekleri üretirken hangi uzman modülleri kullandığını analiz ettiler. 851 tamamlanmış kod örneği üzerinde yapılan çalışmada, aynı kodları üreten durumlar ile farklı kodlar üreten durumlar arasında uzman seçimi benzerliğinin nasıl değiştiğini ortaya koydular. Bulgular, AI modellerinin kod üretiminde daha öngörülebilir davrandığını ve bu durumun hesaplama verimliliğini artırmak için kullanılabileceğini gösteriyor.
Seyrek tensör hesaplamalarında çığır açan paralel işlem algoritması geliştirildi
Araştırmacılar, seyrek tensör cebirinde paralel işlem yükünü dengeli dağıtan ilk algoritmayı geliştirdiler. Seyrek tensörler, çoğunlukla sıfır değerli elemanlardan oluşan çok boyutlu veri yapıları olup, makine öğrenmesi ve bilimsel hesaplamalarda kritik öneme sahip. Ancak bu yapıların düzensiz ve veri-bağımlı doğası, paralel işlem birimlerine eşit iş yükü dağıtımını zorlaştırıyor. Yeni algoritma, mevcut paralel birleştirme yöntemlerini genelleştirerek çok operandlı ve çok boyutlu hiyerarşik seyrek veri yapılarıyla çalışabiliyor. Araştırmacılar algoritmayı mevcut bir derleme çerçevesine entegre ederek, çok çekirdekli CPU'lar ve GPU'lar için otomatik paralel kod üretimi sağladılar. Test sonuçları, üretilen kodun Intel MKL ve NVIDIA cuSPARSE gibi endüstri standardı kütüphanelerle rekabet edebilir performans gösterdiğini ortaya koyuyor. Bu gelişme, büyük veri işleme ve yapay zeka uygulamalarında önemli performans artışları sağlayabilir.
Yapay Zeka Kod Üretiminde Yeni Yaklaşım: Olasılıklı Düşünce Programları
Araştırmacılar, büyük dil modellerinin kod üretimi ve matematiksel akıl yürütme performansını artırmak için 'olasılıklı düşünce programları' adını verdikleri yeni bir test-zamanı çerçevesi geliştirdi. Bu yöntem, modelin daha az GPU hesaplaması kullanarak daha fazla kod örneği üretmesini sağlıyor. Geleneksel yaklaşımda uygun bir program elde edilene kadar sürekli örnekleme yapılırken, yeni teknik modelin olasılık dağılımını doğrudan programlara entegre ederek maliyetli hesaplama sürecini optimize ediyor. Özellikle büyük ölçekli kod üretimi projelerinde kaynak kullanımını dramatik şekilde azaltma potansiyeline sahip bu gelişme, yapay zeka destekli programlama araçlarının verimliliğini artırabilir.
Yapay Zeka Ajanları Kendi Kendine Evrimleşerek Karmaşık Problemleri Çözüyor
Araştırmacılar, büyük dil modellerinin karmaşık optimizasyon problemlerini çözmekte yaşadığı sınırlamaları aşmak için yenilikçi bir çözüm geliştirdi. EvoOR-Agent adlı bu sistem, yapay zeka ajanlarının kendi iş akışlarını evrimsel süreçlerle geliştirmesine olanak tanıyor. Geleneksel yöntemlerin aksine, bu yaklaşım ajan mimarilerini ve mantık yürütme süreçlerini eş zamanlı olarak optimize ediyor. Problem yorumlama, matematiksel formülasyon, çözücü seçimi ve kod üretimi gibi karmaşık görevleri koordine eden sistem, graf tabanlı bir yapı üzerinde çalışarak alternatif çözüm yollarını açık hale getiriyor. Evrimsel algoritmalar kullanarak popülasyon güncellemeleri yapan sistem, deneyim kazanım modülü sayesinde yeniden kullanılabilir pratikleri de bünyesine katıyor.
Yapay Zeka Ajanları Hatalardan Öğrenerek Kod Yazma Becerisini Geliştiriyor
Araştırmacılar, büyük dil modellerinin kod yazma yeteneklerini artıran yeni bir yaklaşım geliştirdi. AdaExplore adlı sistem, her deneme sonrasında aldığı geri bildirimlerden öğrenerek kendini geliştiren bir yapay zeka ajanı. Özellikle Triton gibi özel programlama dillerinde performans kritik kod üretimi konusunda başarılı sonuçlar veriyor. Sistem, hatalardan uyum sağlama ve çeşitliliği koruma olmak üzere iki aşamalı bir yaklaşım kullanarak, ek eğitim veya dış bilgi kaynağına ihtiyaç duymadan hem doğruluk hem de optimizasyon performansını artırıyor.
Yapay Zeka Artık Bilimsel Makaleleri Koda Dönüştürüp Çalıştırabiliyor
Araştırmacılar, bilimsel makalelerdeki deneysel sonuçları otomatik olarak kod haline getirip çalıştırabilen yeni bir yapay zeka sistemi geliştirdi. HiRAS adlı hiyerarşik çoklu ajan çerçevesi, önceki sabit ardışık yaklaşımların aksine, farklı uzmanlık alanlarına sahip yapay zeka ajanlarını koordine eden yönetici ajanlar kullanıyor. Bu sistem, bilimsel araştırmaların yeniden üretilmesinde önemli ilerlemeler sağlıyor. Araştırmacılar ayrıca mevcut değerlendirme yöntemlerindeki eksiklikleri tespit ederek, daha kapsamlı bir test protokolü olan Paper2Code-Extra'yı tanıttı. Bu gelişme, bilimsel araştırmaların otomatikleştirilmesi ve deneysel sonuçların daha kolay doğrulanması açısından büyük önem taşıyor.
Yapay Zeka Modellerini Rekabetçi Oyunla Eğiten Yeni Yöntem Geliştirildi
Araştırmacılar, yapay zeka modellerinin eğitimi için kaliteli veri üretme sorununa yaratıcı bir çözüm getirdi. Geleneksel veri toplama yöntemleri pahalı ve düşük kaliteli sonuçlar verirken, yeni 'Adversarial Arena' yaklaşımı veri üretimini rekabetçi bir oyuna dönüştürüyor. Bu sistemde 'saldırgan' takımlar zor sorular hazırlarken, 'savunucu' takımlar bu sorulara yanıt üretiyor. 10 üniversite takımının katıldığı siber güvenlik odaklı yarışmada 19.683 çok turlu konuşma verisi üretildi. Bu verilerle eğitilen açık kaynak model, güvenli kod üretiminde %18,47 iyileşme gösterdi. Yöntem, özellikle kaynak kısıtı olan alanlarda ve karmaşık konuşma verilerinin üretilmesi için büyük potansiyel taşıyor.
LeGo-Code: Yapay Zeka Modelleri Karmaşık Kodları Nasıl Öğrenebilir?
Araştırmacılar, doğal dili kod haline çeviren büyük dil modellerinin karmaşık veritabanı sorgularında yaşadığı zorlukları çözmek için yeni bir yaklaşım geliştirdi. Text-to-SQL teknolojisi, teknik bilgisi olmayan kullanıcıların doğal dille veritabanlarından bilgi almasını sağlıyor ancak çoklu tablolar arası karmaşık bağlantılar ve iç içe geçmiş sorguları işlemekte zorlanıyor. LeGo-Code adlı yeni sistem, modüler müfredat öğrenme yöntemiyle bu sorunu çözmeyi hedefliyor. Geleneksel yaklaşımların aksine, basit örneklerden karmaşığa doğru sıralı öğrenme stratejisi uyguluyor. Spider ve BIRD gibi benchmark testlerde yapılan denemeler, naif müfredat yaklaşımının yeterli olmadığını, ancak daha sofistike stratejilerin umut verici sonuçlar verdiğini gösteriyor. Bu çalışma, yapay zekanın kod üretme kabiliyetlerini geliştirmek için önemli ipuçları sunuyor.
Yapay Zeka Ödül Modellerinde Çok Aşamalı İşlem Hatası Çözüldü
Büyük dil modellerinin insan tercihlerine uyumlu hale getirilmesinde kritik rol oynayan ödül modelleri, çok aşamalı yapay zeka sistemlerinde beklenmedik tutarsızlıklar sergiliyor. Araştırmacılar, tek adımlık üretim için tasarlanan mevcut ödül modellerinin, gerçek dünya uygulamalarında yaygın olan çok aşamalı süreçlerde yetersiz kaldığını keşfetti. Bu sorunu çözmek için geliştirilen PARM (Pipeline-Adapted Reward Model), ödül tahminleri ile gerçek sistem performansı arasındaki tutarsızlığı gideriyor. Kombinatorik optimizasyon problemleri üzerinde test edilen sistem, formülasyon ve kod üretimi aşamalarını entegre ederek daha güvenilir sonuçlar üretiyor. Bu gelişme, yapay zeka sistemlerinin karmaşık görevlerdeki performansını artırmada önemli bir adım.
Yapay Zeka Ajanları Artık Finansal Araştırmalarda Ekip Çalışması Yapıyor
Araştırmacılar, kantitatif finans alanında çalışan bir araştırma ekibini taklit eden çok ajanlı yapay zeka sistemi geliştirdi. QRAFTI adlı bu framework, büyük finansal veri setleri üzerinde hisse senedi faktör analizi yapabiliyor. Sistem, veri erişimi, faktör oluşturma ve özel kodlama işlemlerini entegre ederek, hem bilinen finansal faktörleri yeniden oluşturabiliyor hem de yeni sinyaller geliştirebiliyor. Dinamik kod üretiminden farklı olarak, zincirleme araç çağrıları ve yansıma tabanlı planlama kullanarak daha iyi performans ve açıklanabilirlik sunuyor. Araştırma raporları ve anlatı analizleri otomatik olarak üretiyor.
Yapay Zeka Modellerinde Yeni Güvenlik Açığı: Tek Kullanıcıyla 'Hipnoz' Saldırısı
Araştırmacılar, kullanıcı geri bildirimlerini öğrenen yapay zeka modellerinde kritik bir güvenlik açığı keşfetti. 'LLM Hipnozu' adı verilen bu yöntemde, kötü niyetli bir kullanıcı sadece sorular sorarak ve yanıtları oylarıyla değerlendirerek, modelin tüm kullanıcılara vereceği yanıtları kalıcı olarak değiştirebiliyor. Saldırgan, modelden bazen zararlı bazen normal yanıtlar üretmesini sağlayıp, zararlı olanları onaylarken normal olanları reddediyor. Bu süreç, modelin tercih öğrenme sistemini manipüle ederek yanlış bilgi enjeksiyonu, güvenlik açıklı kod üretimi ve sahte finansal haberler yayma gibi ciddi sonuçlara yol açabiliyor.
RefineStat: Yapay Zeka ile Olasılıklı Program Yazımında Yeni Dönem
Araştırmacılar, küçük dil modellerinin olasılıklı program yazarken yaptıkları hataları düzelten yenilikçi bir çerçeve geliştirdi. RefineStat adlı sistem, yapay zekanın belirsizlik içeren matematiksel modeller oluştururken karşılaştığı sözdizimi ve anlam hatalarını otomatik olarak tespit edip düzeltiyor. Olasılıklı programlama, belirsizliklerle dolu gerçek dünya problemlerini modellemek için güçlü bir araç olmasına rağmen, AI modellerinin bu alanda doğru kod üretmesi oldukça zordu. Yeni yaklaşım, alan uzmanlarının hata ayıklama stratejilerinden ilham alarak, üretilen programların geçerli dağılımlar içermesini ve parametrelerin doğru biçimde oluşturulmasını sağlıyor. Güvenilirlik kontrolleri başarısız olduğunda sistem, problematik bileşenleri yeniden örnekliyor ve iyileştiriyor.
Yapay Zeka Modelleri Takım Halinde Çalışarak Daha İyi Kod Yazıyor
Araştırmacılar, farklı yapay zeka modellerinin kod yazma konusunda birbirini tamamlayan güçlü yanları olduğunu keşfetti. Tek bir modelin tüm programlama dillerinde ve problem türlerinde üstün olmadığını gözlemleyen bilim insanları, PerfOrch adlı çok modelli orkestrasyon sistemi geliştirdi. Bu sistem, kod üretimini dört aşamaya bölerek farklı görevlerde en uygun modeli seçiyor: problemi kategorilere ayırma, kod üretme, hata ayıklama ve iyileştirme. Her aşama için özel bir hafıza modülü kullanılarak, programlama diline ve problem türüne göre en başarılı model belirleniyor. Bu yaklaşım, tek model kullanımından çok daha kaliteli kod üretimine olanak sağlıyor ve yapay zeka destekli yazılım geliştirmede yeni bir paradigma sunuyor.