"bilgisayarlı görme" araması

Arama Sonuçları

208 haber

PowerCLIP: Yapay Zeka Görsel-Metin Anlayışında Yeni Dönem

Araştırmacılar, yapay zekanın görsel ve metinsel içeriği birlikte anlamasını geliştiren PowerCLIP adlı yeni bir sistem geliştirdi. Mevcut CLIP teknolojisi tek kelimelerle görsel bölgeleri eşleştirirken, PowerCLIP birden fazla görsel bölgeyi kapsayan karmaşık anlamları yakalayabiliyor. Sistem, görsel bölgelerin her türlü kombinasyonunu metin parçalarıyla eşleştirerek çalışıyor. Bu yaklaşım teorik olarak üstel hesaplama maliyeti gerektirse de, araştırmacılar geliştirdikleri özel algoritmayla bu karmaşıklığı önemli ölçüde azalttı. PowerCLIP'in en önemli avantajı, görüntülerdeki nesneler arası ilişkileri ve bağlamsal anlamları daha iyi kavrayabilmesi. Bu gelişme, yapay zekanın görsel içeriği anlama ve tanımlama yeteneğinde önemli bir ilerleme anlamına geliyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay zeka doküman okumayı gerçek dünya koşullarına hazırlıyor

Araştırmacılar, yapay zekanın dokümanları okuma ve anlama becerisini gerçek dünya koşullarında geliştiren yeni bir yaklaşım geliştirdi. Geleneksel sistemler, düzgün çekilmiş ve standart formattaki belgelerle çalışırken, günlük hayatta karşılaştığımız eğri, buruşuk veya kötü aydınlatılmış dokümanlarda başarısız oluyor. Yeni sistem, gerçekçi sahne sentezi stratejisi ile çok çeşitli doküman türlerini içeren büyük ölçekli eğitim verisi oluşturuyor ve doküman-farkında eğitim yöntemiyle modellerin yapısal tutarlılığını artırıyor. Bu gelişme, ofis otomasyonundan dijital arşivlemeye kadar birçok alanda yapay zeka uygulamalarının daha güvenilir hale gelmesini sağlayabilir.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Dil Modellerini Çökmeden Hızlandıran Yeni Sistem: SLO-Guard

Büyük dil modellerinin hızlı ve güvenilir şekilde çalışması için geliştirilmiş yeni bir sistem, yapay zeka uygulamalarında yaşanan performans sorunlarına çözüm getiriyor. Araştırmacılar, ChatGPT benzeri sistemlerin yanıt süresi gereksinimlerini karşılarken sistem çökmelerini önleyen SLO-Guard adlı akıllı ayarlama aracını geliştirdi. Sistem, çökmeleri başarısızlık olarak görmek yerine değerli veri olarak kullanarak daha etkili optimizasyon yapıyor. Bu yenilik, kullanıcıların AI chatbotlardan daha hızlı ve kesintisiz hizmet almasını sağlayabilir.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Kas İlhamlı Manyetik Aktüatörler: 3D Yazıcıyla Üretilen Yumuşak Robotlar

Araştırmacılar, kas dokusundan ilham alan ve 3D yazıcıyla üretilen yenilikçi manyetik aktüatörler geliştirdi. Bu sistemler büyük deformasyonlar yapabiliyor, yük taşıyabiliyor ve çok fonksiyonlu hareketler gerçekleştirebiliyor. Termoplastik ve nadir toprak mıknatıslarından oluşan kompozit malzemeden üretilen bu aktüatörler, kendi ağırlığının 32 katı kadar yük kaldırabiliyor. Lazer enerjisi ayarlanarak hem mekanik dayanım hem de manyetik yanıt hassas şekilde kontrol edilebiliyor. 0.5 mm kalınlıktaki esnek menteşeler, orta şiddetteki manyetik alanlarda hasar görmeden bükülebiliyor ve katlanabiliyor. Bu teknoloji, gelecek nesil adaptif yumuşak robotlar için kritik bir adım teşkil ediyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Vision Transformer'ların Karar Verme Sürecini Açıklayan Yeni Yöntem Geliştirildi

Bilgisayar görme alanında önemli başarılar elde eden Vision Transformer'lar, karmaşık yapıları nedeniyle nasıl karar verdikleri anlaşılması zor sistemlerdi. Araştırmacılar, bu yapay zeka modellerinin karar verme süreçlerini daha net anlaşılabilir hale getiren Decision-Aware Attention Propagation (DAP) adlı yeni bir yöntem geliştirdi. Bu yaklaşım, modelin dikkat mekanizmasına karar odaklı bilgileri entegre ederek, hangi görsel öğelerin sınıflandırma kararında etkili olduğunu daha açık şekilde gösteriyor. Yöntem, mevcut dikkat tabanlı açıklama yöntemlerinin sınırlılıklarını aşarak, sınıf ayırım kabiliyeti daha yüksek açıklamalar sunuyor.

arXiv (CS + AI) · 24 gün önce

Kimya

Yapay Zeka ile Kimyasal Reaksiyonları Tahmin Etmek Artık Mümkün

Araştırmacılar, difüzyon modellerini kullanarak gaz fazı kimyasal reaksiyonlarının zamanla nasıl değiştiğini tahmin edebilen yeni bir yöntem geliştirdi. Bu yaklaşım, seyrek gözlemlerden hareketle karmaşık kısmi diferansiyel denklem sistemlerini çözebiliyor. Özellikle adveksiyon-reaksiyon-difüzyon denklemleriyle yönetilen kimyasal kinetik problemlerinde test edilen sistem, sadece anlık durumları değil, tam zamansal-uzaysal değişim süreçlerini yeniden oluşturabiliyor. Daha da önemlisi, daha önce hiç görmediği parametre aralıklarında bile başarılı tahminler yapabiliyor. Bu gelişme, laboratuvar deneylerinin simülasyonu ve kimyasal süreçlerin anlaşılması açısından önemli bir adım teşkil ediyor.

arXiv (CS + AI) · 24 gün önce

Uzay & Astronomi

Kozmoloji araştırmalarında objektifliği koruyan yeni yazılım: Smokescreen

Bilim insanları, kozmolojik analizlerde sonuçları önceden bilmenin getirdiği önyargıları önlemek için yeni bir yöntem geliştirdi. Smokescreen adlı Python kütüphanesi, veri vektörlerini geçici olarak gizleyerek araştırmacıların gerçek sonuçları analiz tamamlanmadan görmesini engeller. Bu 'körleme' tekniği, verilerin istatistiksel özelliklerini bozmadan kozmoloji bağımlı kaymalar uygulayarak çalışır. Vera C. Rubin Uzay Gözlemevi'nin gelecek projesi LSST için geliştirilse de, Firecrown olasılık hesaplamaları kullanan tüm deneylerde kullanılabilir. Sistem, orijinal verileri şifreleyerek kazara açılmaya karşı koruma sağlar. Bu yaklaşım, özellikle büyük ölçekli kozmoloji projelerinde bilimsel objektifliği korumak için kritik önem taşıyor.

arXiv (Astronomi) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Robotlarının Çevresel Değişikliklere Adaptasyonu İyileştiriliyor

Görme-Dil-Eylem modellerinde (VLA) yaşanan çevresel değişikliklere karşı kırılganlık sorunu çözüm buluyor. Araştırmacılar, robotların küçük nesne pozisyon değişikliklerinde bile başarısız olma problemini 'yörünge aşırı öğrenme' olarak tanımlıyor. Bu durumda robotlar, eylemler ve nesneler arasındaki sahte korelasyonlara odaklanarak ezberledikleri kalıpları tekrarlıyor. Yeni geliştirilen PDF (Perturbation learning with Delayed Feedback) yöntemi, temel modelde ince ayar yapmadan test zamanında adaptasyon sağlıyor. Bu yaklaşım, belirsizlik tabanlı veri artırma ve eylem oylama ile sahte korelasyonları azaltırken, adaptif bir zamanlayıcı performans-verimlilik dengesini koruyor. Hafif bir pertürbasyon modülü de gecikmeli geri bildirimle eylem güvenilirliğini retrospektif olarak ayarlıyor.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Tek Kameradan İnsan-Nesne Etkileşimini 4D Olarak Yeniden Yapılandıran Yöntem

Araştırmacılar, tek bir RGB kameradan çekilen görüntülerden insan-nesne etkileşimlerini 4D olarak yeniden yapılandırabilen yeni bir yapay zeka sistemi geliştirdi. CARI4D adlı bu sistem, herhangi bir nesne kategorisine bağımlı olmadan çalışabiliyor ve uzamsal-zamansal tutarlılığı koruyor. Geleneksel yöntemler önceden tanımlanmış nesne şablonlarına veya sınırlı nesne kategorilerine ihtiyaç duyarken, bu yeni yaklaşım çok daha esnek bir yapı sunuyor. Sistem, temel yapay zeka modellerinin tahminlerini akıllıca birleştiren bir algoritma kullanıyor ve render-karşılaştır paradigmasıyla sonuçları iyileştiriyor. Bu gelişme, insan davranışlarını anlama, oyun geliştirme ve robot öğrenmesi alanlarında önemli uygulamalara sahip olabilir.

arXiv (CS + AI) · 24 gün önce

Tıp & Sağlık

Yapay Zeka Göz Hastalıklarını Teşhis Eden Raporları Otomatik Yazıyor

Araştırmacılar, retina görüntülerinden tıbbi rapor üreten yeni bir yapay zeka sistemi geliştirdi. DREAM adlı sistem, göz doktorlarının belirlediği klinik anahtar kelimeleri görsel verilerle birleştirerek, sınırlı veri ile bile yüksek doğrulukta tanı raporu üretiyor. İki aşamalı bir füzyon mekanizması kullanan sistem, önce görüntü ve anahtar kelime özelliklerini ortak bir alanda birleştiriyor, ardından adaptif çok modlu füzyon ile her modalitetin önemini dinamik olarak ayarlıyor. Bu yaklaşım, mevcut görme-dil modellerinin medikal alanlarda yaşadığı veri yetersizliği ve aşırı öğrenme sorunlarını çözmeyi hedefliyor. Özellikle kritik ancak belirgin olmayan patolojileri tespit etmede başarılı olan sistem, oftalmoloji alanında tanı doğruluğunu artırarak doktorlara önemli destek sağlayabilir.

arXiv (CS + AI) · 24 gün önce

Teknoloji & Yapay Zeka

Yapay Zeka Görme Sistemlerinde Güvenlik Açıklarına Karşı Yeni Savunma Yöntemi

Büyük görme-dil modelleri (LVLM), multimodal saldırılara karşı savunmasız durumda. Mevcut koruma yöntemleri ya belirli saldırı türlerine odaklanıyor ya da çok fazla hesaplama gücü gerektiriyor. Araştırmacılar, bu modellerin kendi iç temsillerinden güvenlik sinyalleri çıkaran Temsili Karşıtsal Puanlama (RCS) adında yeni bir framework geliştirdi. Bu yaklaşım, güvenlik açısından kritik katmanlarda zararlı ve zararsız girişleri ayırmak için hafif bir projeksiyon öğreniyor. Böylece hem yeni tehditlere karşı genelleme yapabiliyor hem de pratik kullanım için verimli çalışıyor.

arXiv (CS + AI) · 24 gün önce

← 1 … 11 12 13 14 15 … 18 →