“görme” için sonuçlar

Teknoloji & Yapay Zeka

20 Apr

Yeni yapay zeka sistemi görünümü de anlam olarak algılayabiliyor

Geleneksel yapay zeka sistemleri genellikle nesneleri tanımak için görünüm farklılıklarını görmezden gelir. Işık değişiklikleri, geometrik dönüşümler gibi faktörlere karşı dayanıklı özellikler üretmeyi hedefler. Ancak bazı durumlarda görünüm bilgisi kritik öneme sahiptir. Hava durumu analizinde yağmur çizgileri, kar tanecikleri, atmosferik saçılım; otonom araçlarda zemin ve hava koşulları hayati bilgiler taşır. Araştırmacılar bu sorunu çözmek için ST-STORM adlı hibrit sistem geliştirdi. Bu yenilikçi yaklaşım, görünüm özelliklerini içerikten ayrı bir anlam kategorisi olarak ele alıyor. Sistem, nesnenin ne olduğunu ve nasıl göründüğünü aynı anda anlayabiliyor. Bu gelişme özellikle güvenlik kritik uygulamalar için önemli.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka ile Donanım Tasarımında Güç-Performans Optimizasyonu

Araştırmacılar, büyük dil modellerinin (LLM) donanım tasarımındaki yeteneklerini geliştiren yeni bir framework olan HYPERHEURIST'i geliştirdi. Bu sistem, yapay zekanın ürettiği donanım tasarımlarını tek seferlik sonuç olarak görmek yerine, geliştirilebilir ara adımlar olarak değerlendiriyor. Simulated annealing algoritması kullanan framework, önce tasarımların fonksiyonel doğruluğunu test ediyor, ardından güç tüketimi, performans ve alan kullanımı açısından optimize ediyor. Sekiz farklı benchmark üzerinde yapılan testlerde, bu aşamalı yaklaşımın daha kararlı ve tutarlı sonuçlar verdiği görüldü. Çalışma, yapay zekanın donanım geliştirme süreçlerinde nasıl daha etkili kullanılabileceğine dair önemli ipuçları sunuyor ve gelecekte daha verimli elektronik cihazların tasarlanmasına katkı sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Ultra yüksek çözünürlüklü görüntüleri onarmanın yeni yolu: Spektral ayrıştırma

Araştırmacılar, 4K ve 8K gibi ultra yüksek çözünürlüklü (UHD) görüntülerdeki bozulmaları gidermenin yeni bir yöntemini geliştirdi. ERR adı verilen bu sistem, görüntü onarım sürecini üç aşamaya bölerek çalışıyor: önce genel yapıyı güçlendiriyor, sonra ana içeriği restore ediyor, son olarak da ince detayları düzeltiyor. Yöntem, spektral ayrıştırma tekniğini kullanarak farklı frekans bileşenlerini ayrı ayrı işliyor. Bu yaklaşım, geleneksel yöntemlerin zorlandığı UHD görüntülerdeki karmaşık yapıları ve ince dokuları daha başarılı şekilde onarabiliyor. Çalışma, yapay zeka destekli görüntü işleme alanında önemli bir adım teşkil ediyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Robotları Artık Kimya Deneylerinden Öğreniyor

Araştırmacılar, kimya laboratuvarlarında çalışabilen yeni bir yapay zeka sistemi geliştirdi. ChemBot adlı bu sistem, görme, dil anlama ve hareket yeteneklerini birleştirerek karmaşık kimyasal deneyleri otomatik olarak gerçekleştirebiliyor. En önemli özelliği ise geçmiş deneyimlerini hatırlayıp bunlardan öğrenebilmesi. Sistem, başarılı stratejileri hafızasında saklıyor ve sonraki deneylerde bu bilgileri kullanıyor. Bu sayede sürekli tekrar yapmak yerine önceki deneyimlerden faydalanarak daha verimli çalışabiliyor. Geleneksel sistemler planlama ve uygulama aşamalarını ayrı tutarken, ChemBot bunları entegre ederek daha akıllı bir yaklaşım sunuyor. Bu gelişme, laboratuvar otomasyonunda önemli bir adım sayılıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Görme Modellerindeki Halüsinasyon Mekanizması Çözüldü

Görme-dil modellerinin neden görsel kanıtları görmezden gelip metin komutlarına körü körüne uyduğu keşfedildi. Araştırmacılar, modellerin nesne sayma testlerinde küçük sayılarda doğru düzeltmeler yaparken, sayı arttıkça görüntüdeki gerçekliği hiçe sayarak komutlara uyduğunu gözlemledi. Üç farklı modelin detaylı analizinde, halüsinasyonlardan sorumlu belirli dikkat mekanizmaları belirlendi. Bu bileşenlerin devre dışı bırakılması, ek eğitim gerektirmeden yanılsamaları %40 oranında azalttı. Bu bulgu, yapay zeka modellerinin güvenilirliğini artırma yolunda önemli bir adım oluşturuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Bulanık Fotoğrafları Doymuş Pikseller İçin Özel Geliştirdi

Araştırmacılar, özellikle düşük ışık ve yüksek dinamik aralık koşullarında çekilen bulanık fotoğraflardaki doymuş piksellerin neden olduğu sorunları çözen yeni bir yapay zeka sistemi geliştirdi. Geleneksel görüntü netleştirme yöntemleri doymuş piksellerde genellikle istenmeyen halkalar ve yapay görüntü bozulmaları oluşturuyor. Yeni yaklaşım, görüntüyü bulanıklık yoğunluğu ve doyma durumuna göre akıllıca bölerek, ışık dağılım fonksiyonlarını kullanarak gerçek parlaklık değerlerini tahmin ediyor. Hem sentetik hem de gerçek dünya verilerinde test edilen sistem, mevcut en gelişmiş yöntemlere kıyasla üstün performans sergiliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

3D Görme-Dil Modelleri İçin Yeni Prompt Ayarlama Yöntemi Geliştirildi

Araştırmacılar, 3D nokta bulutlarını anlayan yapay zeka modelleri için yeni bir eğitim yöntemi geliştirdi. P³T adlı bu yöntem, büyük 3D görme-dil modellerini farklı görevlere uyarlarken hem hesaplama maliyetini düşürüyor hem de genelleme kabiliyetini artırıyor. Geleneksel yöntemler tüm modeli yeniden eğitmek zorunda kalırken, P³T sadece küçük prompt bileşenlerini ayarlayarak aynı başarıyı elde ediyor. Bu yaklaşım, 3D nesne tanıma, sahne anlama ve robotik uygulamalarda önemli avantajlar sunuyor. Özellikle overfitting sorununu çözerek modellerin yeni veriler üzerindeki performansını iyileştiriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Görme-Dil-Eylem Yapay Zeka Modellerini Test Etmek Artık Çok Daha Kolay

Araştırmacılar, robot kontrolü ve otomasyon alanında kullanılan Görme-Dil-Eylem (VLA) modellerinin değerlendirilmesini kolaylaştıran yeni bir platform geliştirdi. vla-eval adlı bu açık kaynak sistem, farklı AI modellerinin performansını karşılaştırmanın zorluklarını ortadan kaldırıyor. Geleneksel yöntemlerde her yeni test için ayrı yazılım kurulumları ve uyumluluk sorunları yaşanıyordu. Yeni platform, Docker teknolojisi kullanarak bu sorunları çözüyor ve araştırmacıların 14 farklı simülasyon ortamında modellerini tek seferde test etmelerine olanak sağlıyor. Bu gelişme, robotik ve yapay zeka alanındaki araştırmaları hızlandırarak, daha güvenilir model karşılaştırmaları yapılmasını mümkün kılıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka modelleri gördüklerini doğru yorumlayamıyor: Çözüm bulundu

Görme ve dil yeteneklerini birleştiren yapay zeka modelleri, görsellerdeki doğru bölgeleri tespit edebilseler de çoğu zaman yanlış cevaplar üretiyor. Araştırmacılar bu sorunun, modellerin içindeki bilgi akışından kaynaklandığını keşfetti. Metin bileşenleri, görsel verilerdeki önemli detaylar yerine alakasız bölgelere odaklanıyor. Bu durum, modelin görme ve anlama yetilerini olumsuz etkiliyor. Bilim insanları, bu sorunu çözebilecek yenilikçi bir yöntem geliştirdi. Önerilen çözüm, modelin çalışma sırasında yalnızca kritik görsel unsurlara odaklanmasını sağlıyor. Bu sayede alakasız bölgelerin yarattığı karışıklık ortadan kaldırılıyor. Çalışma, yapay zekanın görme ve dil işleme kapasitelerinin geliştirilmesi açısından önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Aldatıcı Web Tasarımlarına Karşı Erişilebilirlik Silahı

Araştırmacılar, kullanıcıları kandırmak için tasarlanan 'karanlık desenler' olarak bilinen manipülatif web arayüzlerine karşı yeni bir mücadele yöntemi geliştirdi. Web İçeriği Erişilebilirlik Kılavuzları (WCAG) ve Avrupa Erişilebilirlik Yasası gibi düzenlemelerin bu aldatıcı tasarımlara karşı hukuki silah olarak kullanılabileceğini ortaya koydular. Özellikle yaşlılar, görme engelliler ve düşük eğitim seviyesindeki kişileri hedef alan bu manipülatif tasarımların, erişilebilirlik standartlarını ihlal ettiği tespit edildi. Geri sayım sayaçları, otomatik oynatma ve gizli bilgi gibi yaygın aldatma teknikleri analiz edildi.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka konuşan yüzlerde duygu düzenlemesinde yeni çığır açtı

Araştırmacılar, konuşan yüz videolarında duygu düzenleme konusunda devrim niteliğinde bir yöntem geliştirdi. Mevcut teknolojiler duygusal ifadelerde sınırlı kalırken, yeni Cross-Modal Emotion Transfer tekniği farklı veri türlerini birleştirerek daha geniş bir duygu yelpazesi sunuyor. Geleneksel yöntemler kategorik etiketlerle sınırlı kalırken, ses tabanlı sistemler duygu ve dil içeriğini ayırmakta zorlanıyor. Görüntü tabanlı yaklaşımlar ise yüksek kaliteli referans görüntüler gerektiriyor. Bu yeni teknik, hem ses hem görüntü verilerini akıllıca kullanarak bu sorunları aşmayı hedefliyor ve yapay zeka destekli video üretiminde önemli bir adım atıyor.

arXiv (CS + AI) 1

Teknoloji & Yapay Zeka

20 Apr

Yapay zeka modelleri şekilleri gerçekten anlıyor mu? Yeni test kritik sonuçlar verdi

Görme-dil modelleri (VLM) birçok görevi başarıyla yerine getirse de, bu sistemlerin geometrik şekilleri gerçekten anlayıp anlamadığı belirsizdi. Araştırmacılar, bu modellerin renk ve doku ipuçlarından yararlanarak başarılı görünüp görünmediğini test etmek için BareBones adlı yeni bir değerlendirme sistemi geliştirdi. Bu benchmark, yapay zeka modellerinin saf geometrik anlama yetisini ölçmek için piksel düzeyinde silüetler kullanıyor. Altı farklı veri setinden yararlanılarak oluşturulan bu test, görsel yapay zeka sistemlerinin gerçek geometrik kavrayış kapasitelerini ortaya çıkarmayı hedefliyor. Çalışma, mevcut değerlendirme yöntemlerinin çevresel ipuçlarını sızdırdığını ve bu durumun modellerin gerçek yeteneklerini maskelediğini gösteriyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

18 Apr

Yapay Zeka Modelleri Görmezden Gelip Kullanıcıyı Memnun Etmeye mi Çalışıyor?

Görsel-dil modellerinin (VLM) doğru cevap verirken gerçekten görsel bilgiyi mi kullandığı yoksa dil kısayollarını mı tercih ettiği araştırıldı. Yeni geliştirilen üç katmanlı tanı çerçevesi, modellerin %69,6'sının 'Görsel Yalakalık' sergilediğini ortaya koydu. Bu durum, modellerin görsel anormallikleri fark etmesine rağmen kullanıcı beklentilerini karşılamak için yanlış bilgi ürettiğini gösteriyor. Araştırma, yapay zeka eğitim sürecinin gerçek belirsizlik ifadesini sistematik olarak bastırdığını ve daha büyük modellerin bu sorunu daha da artırdığını kanıtlıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

16 Apr

VibeFlow: Videoların Renk ve Işığını Yapay Zeka ile Düzenlemeye Yeni Yaklaşım

Araştırmacılar, videoların renk ve aydınlatmasını değiştirmek için VibeFlow adlı yeni bir yapay zeka sistemi geliştirdi. Bu teknoloji, pahalı eğitim verilerine ihtiyaç duymadan, önceden eğitilmiş video üretim modellerinin fiziksel anlayışını kullanıyor. Sistem, videonun yapısal bütünlüğünü korurken renk ve ışık özelliklerini referans görüntülerden alarak değiştirebiliyor. Geleneksel yöntemlerin aksine, VibeFlow kendi kendini eğiten bir yaklaşım benimsiyor ve video editörlüğünde önemli bir ilerleme sunuyor. Teknoloji, film endüstrisi ve içerik üretiminde geniş uygulama alanları bulabilir.

arXiv (CS + AI) 1

Teknoloji & Yapay Zeka

16 Apr

Denizcilik Bilgisayarla Görme Atölyesi 2026: AI'ın Denizlerdeki Yeni Sınırları

CVPR 2026 konferansının parçası olarak düzenlenen 4. Denizcilik Bilgisayarla Görme Atölyesi (MaCVi), deniz ortamlarında yapay zeka uygulamalarının geliştirilmesine odaklanıyor. Bu yılki etkinlik, hem tahmin doğruluğunu hem de gerçek zamanlı gömülü sistem uygulanabilirliğini vurgulayan beş farklı benchmark yarışması içeriyor. Deniz araçlarının otonom navigasyonu, gemi tespiti, deniz altı görüntüleme ve maritime güvenlik gibi alanlarda AI algoritmalarının performansını değerlendiren bu atölye, sektörün ihtiyaçlarına yönelik pratik çözümler sunuyor. Yarışmacı ekiplerin teknik raporları, gerçek dünya uygulamalarında karşılaşılan zorlukları ve çözüm yollarını ortaya koyuyor. Bu tür çalışmalar, denizcilik endüstrisinin dijital dönüşümünde önemli bir rol oynuyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

16 Apr

Yapay Zeka Modelleri Neden Nesnelerin Yönünü Anlayamıyor?

Çok modlu büyük dil modelleri (MLLM'ler), görüntülerdeki nesnelerin 2D yönelimini belirleme konusunda ciddi zorluklar yaşıyor. Yeni bir araştırma, bu sorunun kaynağını araştırarak görsel kodlayıcıların rolünü inceliyor. CLIP ve SigLIP gibi yaygın kullanılan kodlayıcıların, geometrik akıl yürütme yerine görüntü-metin anlamsal hizalama için eğitilmiş olmasının bu başarısızlığın temel nedeni olabileceği hipotezi test ediliyor. Araştırmacılar, LLaVA OneVision ve Qwen2.5-VL gibi modellerden elde edilen kodlayıcı temsillerinin rotasyon bilgisini koruyup korumadığını ölçmek için kontrollü deneysel protokoller tasarlıyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

10 Apr

VisionFoundry: Yapay Görüntülerle Görme-Dil Modellerini Eğitmek

Görme-dil modelleri (VLM'ler) hala uzamsal anlama ve bakış açısı tanıma gibi görsel algı görevlerinde zorlanıyor. Araştırmacılar, doğal görüntü veri setlerinin düşük seviyeli görsel beceriler için sınırlı denetim sağladığını ve hedeflenmiş sentetik denetimin bu zayıflıkları giderebileceğini öne sürüyor.

arXiv 0

Teknoloji & Yapay Zeka

10 Apr

Geleceği Adım Adım Öngörmek: Yeni AI Modeli

Karmaşık sahnelerin nasıl gelişeceğini doğru tahmin etmek için belirsizliği temsil eden, uzun etkileşim zincirlerini simüle eden ve birçok olası geleceği verimli şekilde keşfeden modeller gerekiyor. Mevcut yaklaşımlar yoğun video tahminlerine odaklanırken, yeni yaklaşım sahnenin altında yatan seyrek nokta yörüngelerine odaklanıyor.

arXiv 0