“yazılım test” için sonuçlar

Teknoloji & Yapay Zeka

30 Apr

Kuantum Yazılımları İçin Yeni Test Yöntemleri Geliştirildi

Araştırmacılar, kuantum programlarının ne kadar iyi test edildiğini ölçmek için altı yeni kriter geliştirdi. Klasik yazılım testlerinden uyarlanan bu yöntemler, kuantum devrelerinin karmaşık yapısına özgü olarak tasarlandı. QaCoCo adlı araçla 540 farklı kuantum devresi üzerinde yapılan testler, bu devrelerin çoğunun yüksek koşul ve karar kapsamı (%97'ye yakın) elde ettiğini, ancak yol kapsamının (%71) daha sınırlı kaldığını ortaya koydu. Özellikle çoklu kontrollü kapıların bulunduğu devrelerde, olası yolların sayısı hızla artarak test kapsamında dengesizliklere yol açıyor. Kuantum sistemlerinin olasılıksal doğası göz önüne alınarak geliştirilen bu yöntemler, kuantum yazılım geliştirme sürecinde önemli bir boşluğu dolduruyor.

arXiv — Kuantum Fiziği 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka modelleri kod hata ayıklama konusunda başarısız: Yeniden yazıyor ama düzeltmiyor

Araştırmacılar, günümüzün en gelişmiş yapay zeka modellerinin kod hata ayıklama konusunda beklenenin çok altında performans sergilediğini ortaya çıkardı. GPT ve DeepSeek gibi önde gelen modeller, hatalı kodları düzeltmek yerine baştan yeniden yazma eğilimi gösteriyor. Yeni geliştirilen Precise Debugging Benchmark (PDB) test sistemi, bu modellerin birim testlerden %76 oranında geçmesine rağmen, hassaslık açısından %45'in altında kaldığını gösteriyor. Bu durum, yapay zekanın gerçek programlama iş akışlarında kullanımı açısından önemli bir sınırlama oluşturuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay zeka ile yazılım testlerini otomatik iyileştiren yöntem geliştirildi

Araştırmacılar, yazılım geliştirmede kritik öneme sahip test süreçlerini otomatikleştiren yeni bir yöntem geliştirdi. Bu yöntem, mevcut entegrasyon testlerinden yararlanarak otomatik olarak birim testleri oluşturuyor. Geleneksel test piramidi yapısına uymayan projelerde özellikle etkili olan sistem, statik ve dinamik analiz tekniklerini birleştiriyor. Yazılım projelerinde genellikle entegrasyon ve sistem testleri çoğunlukta olduğunda, testler daha yavaş çalışır ve hataların kaynağını bulmak zorlaşır. Yeni yöntem bu sorunu çözerek, bileşenleri izolasyon halinde test eden birim testler üretiyor. Node.js platformunda yapılan deneyler, yöntemin başarılı sonuçlar verdiğini gösteriyor. Bu gelişme, yazılım kalitesini artırırken geliştirme süreçlerini hızlandırabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Artık Kodlardaki Gizli Hataları Daha İyi Buluyor

Araştırmacılar, yazılım testlerinde devrim yaratabilecek yeni bir yapay zeka sistemi geliştirdi. GLMTest adlı bu sistem, geleneksel metin tabanlı yaklaşımların aksine kodun yapısal özelliklerini anlayarak test senaryoları üretiyor. Graf sinir ağları ve dil modellerini birleştiren bu yaklaşım, yazılımların riskli bölümlerini hedefleyerek güvenlik açıklarını ve kritik hataları tespit etme başarısını önemli ölçüde artırıyor. Sistem, mevcut yöntemlere kıyasla %83 daha yüksek doğrulukla hedeflenen kod dallarına ulaşabiliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Büyük Dil Modelleri Gerçek Dünya Kodlarını Analiz Etmekte Ne Kadar Başarılı?

Araştırmacılar, yapay zeka sistemlerinin matematik problemlerindeki başarısının gerçek yazılım kodlarını anlama yetisini gösterip göstermediğini test etmek için yeni bir değerlendirme sistemi geliştirdi. Amazon'un kripto kütüphanesi s2n-bignum'dan türetilen bu test, büyük dil modellerinin endüstriyel seviyedeki assembly kodlarını ne kadar iyi analiz edebildiğini ölçüyor. Sistem, matematiksel teoremler yerine gerçek dünyada kullanılan karmaşık yazılımları temel alıyor ve AI'ın pratik programlama görevlerindeki gerçek performansını ortaya çıkarıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Büyük Dil Modelleri Yazılım Güvenlik Testlerinde Çığır Açıyor

Araştırmacılar, yazılım güvenlik açıklarını bulmak için kullanılan fuzzing testlerini büyük dil modelleriyle (LLM) geliştiren yenilikçi bir sistem tasarladı. SDLLMFuzz adlı bu framework, özellikle karmaşık yapılandırılmış girdi gerektiren programlarda etkili. Geleneksel fuzzing yöntemleri, sözdizim kuralları katı olan programlarda geçerli test girdileri üretmekte zorlanıyor ve derin kod yollarını keşfedemiyor. Yeni yaklaşım, LLM'lerin dil anlayışı yeteneklerini statik kod analizi ve dinamik geri bildirimle birleştireyor. Bu sayede hem sözdizimsel olarak doğru hem de anlamsal olarak mantıklı test girdileri üretilebiliyor. Sistem, çalışma zamanı geri bildirimlerini kullanarak kendini sürekli iyileştiren bir döngü oluşturuyor. Araştırma, yapay zekanın siber güvenlik alanındaki potansiyelini gösteriyor ve yazılım geliştirme süreçlerinde daha güvenli uygulamalar oluşturulmasına katkı sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Destekli Test Sistemi Yazılım Güvenliğini Artırıyor

Araştırmacılar, yazılım kütüphanelerinin güvenlik testlerini otomatikleştiren yeni bir sistem geliştirdi. MASFuzzer adı verilen bu framework, büyük dil modellerini kullanarak yazılımlardaki potansiyel güvenlik açıklarını daha etkili şekilde tespit ediyor. Geleneksel yöntemlerde geliştiricilerin manuel olarak hazırladığı test sürücüleri yerine, sistem otomatik olarak çok boyutlu API dizileri oluşturuyor ve adaptatif planlama stratejileri kullanıyor. Bu yaklaşım, yazılımların derin program dallarına ulaşarak daha kapsamlı testler yapılmasını sağlıyor. Yazılım güvenliğinin kritik önem taşıdığı günümüzde, bu tür otomatik test sistemleri siber güvenlik açıklarının önceden tespit edilmesinde önemli rol oynuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Java Uygulamalarındaki Güvenlik Açıklarını Tespit Eden Yeni Sistem: GONDAR

Araştırmacılar, Java uygulamalarındaki güvenlik açıklarını daha etkili bir şekilde tespit edebilen GONDAR adlı yeni bir sistem geliştirdi. Bu çerçeve, güvenlik açısından hassas API'ların semantiklerini sistematik olarak kullanarak hedefli zafiyet keşfi yapıyor. Java uygulamaları, dosya işlemlerinden uzaktan kod çalıştırmaya kadar birçok güvenlik riski taşıyor. GONDAR, bu riskleri daha doğru tespit etmek için yapay zeka destekli filtreleme ve özelleştirilmiş ajanlar kullanıyor. Sistem, önce erişilebilir ve istismar edilebilir API çağrı noktalarını belirliyor, ardından iki uzman ajan devreye giriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Kuantum Yazılım Testleri İçin 700 Bin Hatalı Devre Veri Bankası

Araştırmacılar, kuantum yazılımların test edilmesi için kritik bir kaynak olan QMutBench veri setini geliştirdiler. Bu kapsamlı koleksiyon, 700 binden fazla hatalı kuantum devre örneği içeriyor ve geliştiricilerin test sistemlerinin etkinliğini değerlendirmelerine olanak tanıyor. Kuantum bilgisayar teknolojisinin hızla gelişmesiyle birlikte, bu sistemlerin güvenilirliğini sağlamak için etkili test yöntemlerine duyulan ihtiyaç artıyor. QMutBench, çevrimiçi bir arayüz üzerinden erişilebilen ve farklı hata türlerini, hayatta kalma oranlarını ve devre özelliklerini filtreleyebilen gelişmiş bir platform sunuyor. Bu kaynak, kuantum yazılım geliştirme alanında önemli bir boşluğu dolduruyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka yazılım testlerinde yeni dönem: TestDecision algoritması geliştirildi

Araştırmacılar, açık kaynaklı büyük dil modellerinin yazılım testi konusundaki en büyük eksiklerinden birini çözen yeni bir algoritma geliştirdi. TestDecision adlı bu sistem, test paketi oluşturma sürecini matematiksel optimizasyon problemi olarak ele alarak, mevcut testlerin kapsamını değerlendirip en yüksek faydayı sağlayacak yeni testleri seçebiliyor. Geleneksel sistemlerin aksine, bu yaklaşım bütüncül bir bakış açısıyla çalışarak daha verimli test süreçleri oluşturuyor. Çalışma, özellikle veri gizliliği ve maliyet endişeleri nedeniyle açık kaynaklı modelleri tercih eden akademik ve endüstriyel kullanıcılar için önemli bir gelişme sunuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka ile yazılım testlerini otomatikleştiren yeni sistem geliştirildi

Yazılım geliştirmede en zorlu aşamalardan biri olan test sürecini devrim niteliğinde değiştiren yeni bir sistem geliştirildi. MR-Coupler adlı bu sistem, büyük dil modellerini kullanarak yazılım kodlarındaki fonksiyonel bağlantıları analiz ediyor ve otomatik olarak test senaryoları üretiyor. Geleneksel yaklaşımların aksine, sistem uzman bilgisi gerektirmeden kaynak kodda mevcut olan fonksiyonel eşleşmeleri tespit ederek metamorfik test ilişkileri kurabiliyor. 100 insan yazımı test durumu ve 50 gerçek dünya projesi üzerinde yapılan değerlendirmeler, sistemin yanlış alarm oranını önemli ölçüde azalttığını gösteriyor. Bu gelişme, yazılım kalitesini artırırken test süreçlerini hızlandıracak ve yazılım geliştirme maliyetlerini düşürecek potansiyele sahip.

arXiv (CS + AI) 0