“hata ayıklama” için sonuçlar

Teknoloji & Yapay Zeka

1 May

Yapay zeka kodlayıcıları artık ne zaman hatırlayacağını biliyor

Büyük dil modellerine dayalı kodlama ajanları, geçmiş hata ayıklama deneyimlerini yeniden kullanmak için hafızalarına güveniyorlar. Ancak bu hafıza bilgisi sadece mevcut hatayla gerçekten uyumlu olduğunda yararlı oluyor. Araştırmacılar, bu sorunu çözmek için risk-duyarlı bağlamsal bandit yaklaşımını geliştirdiler. RSCB-MC adlı yeni sistem, yapay zeka ajanının hangi durumda hafıza kullanacağına, ne zaman geri çekileceğine veya kullanıcıdan geri bildirim isteyeceğine karar veriyor. Bu yaklaşım, yanlış hafıza enjeksyonunu önleyerek daha güvenli ve etkili kod geliştirme süreçleri sunuyor.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

22 Apr

Yapay Zeka Matematik Teoremlerini Daha Hızlı İspatlıyor: Derleyici Tabanlı Yeni Yöntem

Büyük dil modelleri matematik teoremlerini ispatlama konusunda büyük potansiyel gösterse de, mevcut yöntemler çok fazla hesaplama gücü gerektiriyor. Araştırmacılar, derleyicilerin hata ayıklama süreçlerinden ilham alan yenilikçi bir yaklaşım geliştirdi. Yeni yöntem, ispat denemelerinin çeşitliliğini kompakt hata modelleriyle sıkıştırarak, yapay zekanın teorem ispatlama yeteneklerini önemli ölçüde artırıyor. Bu gelişme, formal matematik doğrulamasında hesaplama maliyetlerini düşürürken performansı yükseltmesi açısından önemli bir adım.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka modelleri kod hata ayıklama konusunda başarısız: Yeniden yazıyor ama düzeltmiyor

Araştırmacılar, günümüzün en gelişmiş yapay zeka modellerinin kod hata ayıklama konusunda beklenenin çok altında performans sergilediğini ortaya çıkardı. GPT ve DeepSeek gibi önde gelen modeller, hatalı kodları düzeltmek yerine baştan yeniden yazma eğilimi gösteriyor. Yeni geliştirilen Precise Debugging Benchmark (PDB) test sistemi, bu modellerin birim testlerden %76 oranında geçmesine rağmen, hassaslık açısından %45'in altında kaldığını gösteriyor. Bu durum, yapay zekanın gerçek programlama iş akışlarında kullanımı açısından önemli bir sınırlama oluşturuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka sistemleri artık kendi hatalarını tespit edip düzeltebilecek

Araştırmacılar, çoklu yapay zeka sistemlerinin karmaşık hatalarını otomatik olarak tespit edebilen ErrorProbe adlı yeni bir framework geliştirdi. Büyük dil modellerine dayalı çok-ajanlı sistemler karmaşık problemleri çözebilme kabiliyeti sunarken, uzun etkileşim zincirleri ve ajanlar arası bağımlılıklar nedeniyle hata ayıklama süreçleri oldukça zorlaşıyor. Mevcut tanı yöntemleri pahalı uzman değerlendirmelerine ya da 'LLM-hakim' yaklaşımlarına dayanıyor ve genişletilmiş bağlamlarda kritik hata adımlarını belirlemekte yetersiz kalıyor. Yeni sistem, sorumlu ajanları ve hata kaynağını belirleyebilen üç aşamalı bir süreç kullanıyor: yerel anormallikleri tespit etme, belirtiye dayalı geriye dönük iz sürme ve özel bir çok-ajanlı ekiple hata hipotezlerini doğrulama. Bu gelişme, yapay zeka sistemlerinin güvenilirliğini artırarak daha karmaşık uygulamalarda kullanımını kolaylaştıracak.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Ajanlarındaki Hataları Kendini Onaran Sistem: SelfHeal

Büyük dil modelleri (LLM) tabanlı yapay zeka ajanları, yazılım geliştirmede devrim yaratırken beraberinde yeni hata ayıklama zorluklarını da getiriyor. Araştırmacılar, Stack Overflow, GitHub ve HuggingFace forumlarından topladıkları verilerle LLM ajanlarındaki hata türlerini analiz etti. Çalışma sonucunda, bu ajanların hatalarını otomatik olarak tespit edip düzeltebilen 'SelfHeal' adlı çok ajanlı sistem geliştirildi. Bu sistem, geliştiricilerin karmaşık yapay zeka uygulamalarında karşılaştıkları sorunları çözme konusunda önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka ajanları artık duruma göre görev dağıtımı yapabiliyor

Araştırmacılar, yapay zeka ajanlarının görev dağıtımında devrim niteliğinde bir yaklaşım geliştirdi. CADMAS-CTX adlı yeni framework, ajanların yeteneklerini sabit kabul etmek yerine, görevin bağlamına göre değerlendiriyor. Örneğin bir kodlama ajanı kısa düzenlemelerde başarılı olurken, uzun süreli hata ayıklama işlerinde zorlanabilir. Geleneksel sistemler bu farklılıkları göz ardı ederek yanlış görev dağıtımlarına neden oluyordu. Yeni sistem, her ajan için farklı beceri alanlarında ve bağlamlarda ayrı deneyim profilleri oluşturuyor. Görev dağıtımı yaparken hem performans ortalamasını hem de belirsizlik seviyesini dikkate alan risk bilincli bir yaklaşım benimsiyor. Bu sayede ajanlar, yalnızca bir meslektaşının gerçekten daha iyi olduğuna dair yeterli kanıt bulunduğunda görev devri yapıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Hata Açıklamalarında Güvenilirlik Sorunu: Yeni Değerlendirme Yöntemi

Büyük dil modelleri (LLM) tabanlı hata ayıklama sistemleri, yazılım hatalarını açıklarken yanıltıcı bilgiler verebiliyor. Araştırmacılar, bu açıklamaların kalitesini artırmak için yeni bir değerlendirme yaklaşımı geliştirdi. Çalışma, mevcut sistemlerin hata açıklamalarını ikincil bir ürün olarak gördüğünü ve asıl nedensel mekanizmaları tam olarak yakalayamadığını ortaya koyuyor. Yeni yöntem, kod parçalarını bağlamsal olarak bölerek ve yapay zekayı hakim olarak kullanarak daha güvenilir açıklamalar üretmeyi hedefliyor. Bu gelişme, yazılım geliştirme süreçlerinde hata tespiti ve düzeltme işlemlerinin daha etkili hale gelmesine katkı sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

RefineStat: Yapay Zeka ile Olasılıklı Program Yazımında Yeni Dönem

Araştırmacılar, küçük dil modellerinin olasılıklı program yazarken yaptıkları hataları düzelten yenilikçi bir çerçeve geliştirdi. RefineStat adlı sistem, yapay zekanın belirsizlik içeren matematiksel modeller oluştururken karşılaştığı sözdizimi ve anlam hatalarını otomatik olarak tespit edip düzeltiyor. Olasılıklı programlama, belirsizliklerle dolu gerçek dünya problemlerini modellemek için güçlü bir araç olmasına rağmen, AI modellerinin bu alanda doğru kod üretmesi oldukça zordu. Yeni yaklaşım, alan uzmanlarının hata ayıklama stratejilerinden ilham alarak, üretilen programların geçerli dağılımlar içermesini ve parametrelerin doğru biçimde oluşturulmasını sağlıyor. Güvenilirlik kontrolleri başarısız olduğunda sistem, problematik bileşenleri yeniden örnekliyor ve iyileştiriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri Takım Halinde Çalışarak Daha İyi Kod Yazıyor

Araştırmacılar, farklı yapay zeka modellerinin kod yazma konusunda birbirini tamamlayan güçlü yanları olduğunu keşfetti. Tek bir modelin tüm programlama dillerinde ve problem türlerinde üstün olmadığını gözlemleyen bilim insanları, PerfOrch adlı çok modelli orkestrasyon sistemi geliştirdi. Bu sistem, kod üretimini dört aşamaya bölerek farklı görevlerde en uygun modeli seçiyor: problemi kategorilere ayırma, kod üretme, hata ayıklama ve iyileştirme. Her aşama için özel bir hafıza modülü kullanılarak, programlama diline ve problem türüne göre en başarılı model belirleniyor. Bu yaklaşım, tek model kullanımından çok daha kaliteli kod üretimine olanak sağlıyor ve yapay zeka destekli yazılım geliştirmede yeni bir paradigma sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

DynaFix: Kod Hatalarını İnsanlar Gibi Adım Adım Düzelten Yapay Zeka

Araştırmacılar, yazılımlardaki hataları otomatik olarak düzelten yeni bir yapay zeka sistemi geliştirdi. DynaFix adlı bu sistem, geleneksel yaklaşımlardan farklı olarak programların çalışma anındaki davranışlarını analiz ederek, tıpkı deneyimli bir programcının yaptığı gibi adım adım hata ayıklama yapabiliyor. Mevcut sistemler çoğunlukla kodun statik analizine odaklanırken, DynaFix programın gerçek zamanlı çalışma verilerini kullanarak daha etkili çözümler üretiyor. Bu yaklaşım, karmaşık yazılım hatalarının çözümünde önemli bir ilerleme vaat ediyor ve yazılım geliştirme süreçlerini hızlandırabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Çip İletişimini Çözümleyen Yapay Zeka Sistemi: AutoFlows++

Modern sistem çipleri (SoC) milyarlarca transistör içeren karmaşık yapılardır ve bu çiplerdeki bileşenler arası iletişimi anlamak kritik önem taşır. Araştırmacılar, karmaşık çip tasarımlarındaki mesaj akışlarını analiz eden AutoFlows++ adlı yeni bir yapay zeka sistemi geliştirdi. Bu sistem, çip bileşenleri arasındaki iletişim izlerini hiyerarşik bir yaklaşımla analiz ederek, daha önce çözülmesi zor olan karmaşık mesaj kalıplarını tespit edebiliyor. Sistem, çip doğrulama, performans analizi ve hata ayıklama süreçlerinde devrim yaratma potansiyeli taşıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

LLM Hata Ayıklama Sistemlerinde Kritik Güvenlik Açığı Keşfedildi

Araştırmacılar, bulut hizmetlerinin günlük dosyalarını analiz eden yapay zeka sistemlerinde ciddi bir güvenlik açığı tespit etti. LogJack adlı bu saldırı yöntemi, zararlı komutları günlük kayıtlarının içine gizleyerek AI sistemlerini kandırıyor. 8 farklı büyük dil modeli üzerinde yapılan testlerde, bazı modellerin %86'ya varan oranlarda zararlı komutları aynen çalıştırdığı görüldü. En güvenli model Claude Sonnet olurken, Llama 3.3 en savunmasız model olarak öne çıktı. AWS, Google Cloud ve Azure'un güvenlik sistemleri bu saldırıları tespit etmede büyük ölçüde başarısız oldu. Bu keşif, AI sistemlerinin bulut altyapılarında kullanımının yaygınlaştığı dönemde kritik önem taşıyor.

arXiv (CS + AI) 0