“bilgisayar görüsü” için sonuçlar
40 sonuç bulundu. Sonuçları kategoriye göre daraltabilirsin.
Yapay Zeka Görüntüleri Tanıyor Ama Sayamıyor: Araştırmacılar Çözüm Arıyor
Günümüzün yapay zeka sistemleri görüntüleri tanımlayabiliyor, nesneleri ayırt edebiliyor ve karmaşık ilişkileri açıklayabiliyor. Görsel-dil modelleri olarak adlandırılan bu sistemler, metin ve görüntü anlayışını etkileyici şekillerde birleştiriyor. Ancak şaşırtıcı bir şekilde, görünüşte basit olan sayma işleminde zorlanıyorlar. Hof Uygulamalı Bilimler Üniversitesi araştırmacıları, yapay zekanın bu temel eksikliğini gidermek için yeni çalışmalar yürütüyor. Bu durum, AI teknolojisinin hızla gelişmesine rağmen bazı temel bilişsel yeteneklerde hala sınırları olduğunu gösteriyor.
Yapay zeka yusufçuk ve kızböceklerinin renklerini otomatik tespit edebilecek
Araştırmacılar, iklim değişikliğinin böceklerin fiziksel özelliklerine etkisini daha hızlı inceleyebilmek için yeni bir yapay zeka sistemi geliştirdi. Sistem, yusufçuk ve kızböceği (Odonata) fotoğraflarından vücut parçalarını otomatik olarak ayırt ediyor ve her bölümün renklerini çıkarıyor. Geleneksel yöntemlerle böcek özelliklerini analiz etmek çok zaman alıyor ve pahalı. Bu yeni yaklaşım, vatandaş bilimi platformlarından alınan açık kaynak görüntüleri kullanarak büyük ölçekli analizlere olanak tanıyor. Derin öğrenme algoritmaları sayesinde böceklerin baş, göğüs, karın ve kanat bölümlerini hassas şekilde segmentlere ayırabiliyor ve her parçanın renk paletini oluşturuyor.
Biyolojik Dizileri Görüntüye Dönüştüren Yeni Yöntem Keşfedildi
Araştırmacılar, DNA ve protein gibi biyolojik dizileri geometrik görüntülere dönüştürebilen yenilikçi bir kodlama sistemi geliştirdi. MS-RCGR adı verilen bu yöntem, karmaşık biyolojik verileri farklı çözünürlüklerde analiz etmeyi mümkün kılıyor. Sistem, geleneksel makine öğrenmesi, bilgisayar görüşü ve hibrit yaklaşımları bir araya getiriyor. En önemlisi, dönüştürme işlemi tamamen geri çevrilebilir, yani hiçbir veri kaybı yaşanmıyor. Bu gelişme, biyoinformatik alanında dizilerin sınıflandırılması ve analizi için yeni kapılar açıyor.
FlashFPS: Büyük Ölçekli 3D Nokta Bulutları İçin Hızlandırma Yöntemi
Araştırmacılar, 3D nokta bulutlarını işleyen yapay sinir ağlarında kritik bir darboğaz olan En Uzak Nokta Örneklemesi (FPS) işlemini önemli ölçüde hızlandıran yeni bir yöntem geliştirdi. FlashFPS adlı bu sistem, gereksiz hesaplamaları ayıklayarak ve sonuçları önbelleğe alarak işlem süresini dramatik olarak azaltıyor. Yöntem, büyük ölçekli 3D veri işleme uygulamalarında performans sorunlarını çözmek için tasarlandı ve mevcut sistemlere kolayca entegre edilebilen donanım-bağımsız bir çözüm sunuyor.
Yapay Zeka ile 3D Sahneleri Tutarlı Şekilde Düzenleme Yöntemi Geliştirildi
Araştırmacılar, 3D sahnelerin metin komutlarıyla düzenlenmesinde yaşanan görüş tutarsızlığı sorununu çözen yeni bir yöntem geliştirdi. Mevcut teknikler farklı açılardan render edilen görüntüleri ayrı ayrı düzenleyip optimize ettiği için tutarsızlıklar ortaya çıkıyordu. Yeni yaklaşım, çoklu görüntü düzenlemeyi ortak dağılım modelleme perspektifinden ele alarak, farklı bakış açıları arasındaki bağımlılıkları açıkça düzenleme sürecine dahil ediyor. Bu sayede sanal gerçeklik, oyun tasarımı ve dijital içerik üretiminde daha tutarlı sonuçlar elde edilebiliyor.
Yapay Zeka Modelleri Artık Unutmadan Yeni Bilgiler Öğrenebilecek
Araştırmacılar, yapay zeka modellerinin yeni kategorileri öğrenirken eski bilgilerini kaybetme sorununu çözen yeni bir yöntem geliştirdi. GR4CIL adlı bu sistem, CLIP modellerinin sürekli öğrenme yeteneğini artırarak, daha önce öğrenilen bilgileri korurken yeni kavramları edinmeyi sağlıyor. Geleneksel yapay zeka modelleri yeni verilerle eğitildiğinde eski bilgilerini unutma eğiliminde, ancak bu yeni yaklaşım görev odaklı bilgi yönlendirme ve ortogonal telafi mekanizması kullanarak bu sorunu aşıyor. Sistem, görsel ve metinsel bilgiyi ayrı şekilde işleyerek görevler arası müdahaleyi azaltıyor.
Yapay Zeka Artık Uzun Videolarda Tutarlı Sahneler Üretebiliyor
Araştırmacılar, uzun süreli video üretiminde karşılaşılan temel sorunlardan birini çözen yenilikçi bir yapay zeka sistemi geliştirdi. Geleneksel yöntemler, kamera hareket ettiğinde aynı sahneye geri döndüğünde tutarsız içerikler üretiyordu. Yeni sistem, hafıza kontrolünü video üretiminden ayırarak bu sorunu çözüyor. Hafif bir hafıza dalı kullanarak geçmiş gözlemlerden öğrenen sistem, hem mekânsal tutarlılığı korumakta hem de yeni alanları keşfetme yetisini sürdürmekte. Bu gelişme, sanal gerçeklik, sinema ve oyun sektörlerinde devrim yaratabilir.
Ouroboros: Görüntü İşlemede Çift Yönlü Yapay Zeka Modeli Geliştirdi
Araştırmacılar, görüntü oluşturma ve analiz etme işlemlerini tek seferde gerçekleştiren yenilikçi bir yapay zeka sistemi geliştirdi. Ouroboros adlı bu sistem, bir görüntüden 3D sahne bilgilerini çıkarabilirken, aynı zamanda bu bilgilerden tekrar görüntü oluşturabiliyor. Geleneksel yöntemlerin aksine, bu iki işlemi birbirini destekleyecek şekilde aynı anda yaparak hem daha tutarlı sonuçlar elde ediyor hem de işlem süresini önemli ölçüde kısaltıyor. Sistem, iç mekan ve dış mekan sahnelerinde eşit başarı gösterirken, video işleme alanında da ek eğitim gerektirmeden kullanılabiliyor.
AI Artık Az Örnekle Görüntülerdeki İnce Ayrıntıları Ayırt Edebiliyor
Yapay zeka sistemleri genellikle görüntüleri sınıflandırmak için binlerce örneğe ihtiyaç duyar. Ancak yeni geliştirilen ARF-SFR-Net sistemi, sadece birkaç örnekle bile çok benzer görüntüleri birbirinden ayırabilmeyi başarıyor. Sistem, görüntülerdeki hem mekansal hem de frekans özelliklerini analiz ederken, farklı kategoriler için en uygun görüş alanı boyutunu otomatik olarak belirliyor. Bu teknoloji, tıbbi görüntüleme, kalite kontrol ve nadir türlerin tanımlanması gibi alanlarda devrim yaratabilir. Araştırmacılar, sistemin mevcut episodik eğitim yöntemlerine kolayca entegre edilebileceğini ve çoklu benchmark testlerinde etkili sonuçlar verdiğini bildiriyor.
Gürültülü 3D Verileri Temizlemek İçin Yeni Değerlendirme Yöntemi Geliştirildi
Araştırmacılar, gerçek dünyadan elde edilen gürültülü 3D nokta bulutu verilerini temizleme işlemlerini değerlendirmek için yenilikçi bir yöntem geliştirdi. UGD (Denetimsiz Geometrik Mesafe) adlı bu teknik, geleneksel yöntemlerin aksine temiz referans verilere ihtiyaç duymadan çalışıyor. Mevcut değerlendirme sistemleri hem temizlenmiş hem de orijinal temiz verileri karşılaştırarak ölçüm yapıyordu, ancak gerçek uygulamalarda böyle referans veriler genellikle mevcut değil. Yeni sistem, temiz nokta bulutlarından öğrenilen örüntüleri kullanarak bir referans model oluşturuyor ve bu modeli temel alarak temizleme işleminin kalitesini değerlendiriyor. Bu gelişme, otonom araçlar, robotik ve 3D modelleme gibi alanlarda nokta bulutu temizleme teknolojilerinin gerçek dünya uygulamalarında önemli ilerlemeler sağlayabilir.
Yapay Zeka Bisikletçi ve Yaya Kazalarını Önlemek İçin Gerçek Zamanlı Uyarı Sistemi
Araştırmacılar, şehir kavşaklarında bisikletçi ve yaya çarpışmalarını önlemek için yenilikçi bir erken uyarı sistemi geliştirdi. Tek bir uç cihazda çalışan sistem, ultra-geniş açılı balık gözü kamera kullanarak saniyede 30 kare hızında görüntü işleyebiliyor. Sistem, tehlikeli durumları tespit ettiğinde hem sesli hem de görsel uyarılar veriyor. Araştırmanın en önemli yeniliği, geleneksel kamera sistemlerinin aksine çok daha geniş bir görüş alanı sunması ve karmaşık şehir ortamlarında bile güvenilir performans göstermesi. Özellikle bisikletçiler ve yayaların herhangi bir cihaz taşımalarına gerek kalmadan korunmalarını sağlayacak bu teknoloji, kentsel güvenlik açısından büyük bir potansiyel taşıyor.
Yapay Zeka Modelleri Görselleri Yeteri Kadar Analiz Etmiyor
Stanford araştırmacıları, görsel-dil modellerinin beklenenden çok daha fazla metinsel açıklamalara dayandığını ve görsel bilgileri yeterince kullanmadığını keşfetti. Bu durum 'metin kısayolu öğrenmesi' olarak adlandırılıyor. Araştırmacılar, modellerin görsel güvenilirliğini test etmek için çelişkili metin-görsel çiftleri kullanarak yeni bir değerlendirme sistemi geliştirdi. Geometrik şekiller üzerinde yapılan deneyler, standart CLIP modelinin yanıltıcı metinlerle karşılaştığında performansının %27,5 düştüğünü gösterdi. Ancak optimize edilmiş versiyonda bu düşüş %9,8'e kadar azaltıldı. Bu bulgular, yapay zekanın görsel anlama kapasitesini geliştirmek için daha sofistike eğitim yöntemlerine ihtiyaç olduğunu ortaya koyuyor.
Videolardaki İlişkileri Yorumlayabilen Yeni Yapay Zeka Modeli Geliştirildi
Araştırmacılar, videolardaki nesneler ve aralarındaki ilişkileri daha iyi anlayabilen yeni bir yapay zeka modeli geliştirdi. FReMuRe adlı bu model, özellikle nadir görülen ilişkileri tespit etmede başarılı oluyor. Video analizinde yaşanan temel sorunlardan biri, bazı nesne ilişkilerinin çok sık, bazılarının ise çok nadir görülmesi. Bu durum yapay zekanın nadir ilişkileri öğrenmesini zorlaştırıyor. Yeni model, sık ve nadir ilişkileri ayrı ayrı işleyerek bu sorunu çözüyor. Araştırma, video analizi, güvenlik sistemleri ve içerik moderasyonu gibi alanlarda önemli iyileştirmeler sağlayabilir. Model ayrıca belirsizlik tahminleri yapabilen özel başlıklar kullanarak daha güvenilir sonuçlar üretiyor.
Yapay Zeka Görsel Anlama Teknolojisinde Hiperbolik Geometri Devrimi
Araştırmacılar, yapay zekanın görsel sahneleri anlaması için yeni bir yaklaşım geliştirdi. Geleneksel yöntemler nesneler ve ilişkiler arasındaki hiyerarşik yapıları tam olarak yakalayamıyordu. Yeni HSG sistemi, hiperbolik geometriyi kullanarak bu sorunu çözüyor. Bu özel geometrik uzay, nesneler arasındaki hiyerarşik ilişkileri doğal olarak kodlayabiliyor. Sistem, sahnelerdeki objeleri ve aralarındaki bağlantıları daha yapısal bir şekilde öğreniyor. Test sonuçları, yöntemin grafik seviyesindeki performansını önemli ölçüde artırdığını gösteriyor. Bu gelişme, robot görüşü, otonom araçlar ve artırılmış gerçeklik uygulamaları için önemli.
Yapay Zeka İnsan Hareketlerini 3D Olarak Daha Doğru Tahmin Edebiliyor
Bilgisayar görüşü alanında önemli bir yenilik gerçekleşti. Araştırmacılar, 2D görüntülerden 3D insan pozlarını tahmin etmek için hibrit bir yapay zeka modeli geliştirdi. MixTGFormer adı verilen bu sistem, geleneksel Transformer ağlarını grafik sinir ağları ile birleştirerek hem global hem de lokal özellikleri etkili şekilde analiz ediyor. Yeni yaklaşım, insan iskelet yapısının uzamsal ve zamansal ilişkilerini iki paralel kanal üzerinden aynı anda modelleyebiliyor. Bu teknoloji, spor analizi, sağlık izleme, sanal gerçeklik uygulamaları ve hareket yakalama sistemleri gibi birçok alanda devrim yaratma potansiyeli taşıyor. Sistem, özellikle iskelet eklemlerinin birbirleriyle olan yerel bağlantılarını ve farklı kanallar arası bilgi akışını daha iyi anlayarak, mevcut yöntemlere göre daha hassas sonuçlar üretiyor.
Renkli 3D Nokta Bulutları İçin Yeni Kayıt Yöntemi: GeGS-PCR
Araştırmacılar, 3D nokta bulutlarının kayıt işleminde devrim niteliğinde bir yöntem geliştirdi. GeGS-PCR adlı bu sistem, geleneksel yöntemlerin aksine sadece geometrik bilgilere değil, aynı zamanda renk ve Gaussian bilgilerine de dayanıyor. Özellikle düşük örtüşme oranına sahip veya eksik veri içeren senaryolarda güçlü performans sergiliyor. İki aşamalı yaklaşım benimseyen sistem, çok seviyeli renk kodlayıcısı ve Geometric-3DGS modülü ile yerel komşuluk bilgilerini işleyerek küresel olarak değişmeyen bir geometrik-renk bağlamı oluşturuyor. LORA optimizasyonu sayesinde yüksek performansı korurken, hızlı diferansiyellenebilir render tekniği ile kayıt sürecini iyileştiriyor. Bu yenilik, robotik, otonom araçlar ve artırılmış gerçeklik uygulamalarında kritik öneme sahip 3D görü sistemlerinde önemli gelişmelere kapı açabilir.
Yapay Zeka Artık Nesne Dönüşümlerini Birinci Şahıs Bakışla Görebiliyor
Araştırmacılar, yapay zekanın insan bakış açısından nesne dönüşümlerini anlayabilmesi için yeni bir sistem geliştirdi. EgoIn adlı bu framework, bir nesnenin başlangıç ve hedef durumları arasındaki ara geçiş süreçlerini tahmin edebiliyor. Sistem, örneğin bir elmanın nasıl dilimlendiğini veya bir kutunun nasıl açıldığını birinci şahıs perspektifinden modelleyebiliyor. Bu gelişme, robotik sistemlerin insan hareketlerini daha iyi anlaması ve taklit etmesi açısından büyük önem taşıyor. Teknoloji, özellikle insanlar ve makineler arasındaki etkileşimi güçlendirmek için kritik bir köprü görevi üstleniyor.
SpaceDex: Robot Elleri İçin Yeni Nesil Kavrama Teknolojisi
Araştırmacılar, dar ve engelli alanlarda çalışabilen gelişmiş robot elleri için SpaceDex adında yeni bir sistem geliştirdi. Geleneksel robotik kavrama sistemleri genellikle açık masa üstü ortamlarda test edilirken, gerçek dünyada robotlar raflar, dolaplar ve katmanlı çalışma alanları gibi kısıtlı mekanlarda çalışmak zorunda kalıyor. SpaceDex, bu zorluğu Vision-Language Model tabanlı planlayıcısı ve hiyerarşik kontrol yapısıyla çözüyor. Sistem, birden fazla kamera görüntüsünden engelleri analiz edip yükseklik ilişkilerini değerlendirerek, robot kolu navigasyonu ve el manipülasyonunu ayrı ayrı optimize ediyor. Bu teknolojik ilerleme, ev robotları, endüstriyel otomasyon ve dar alanlarda çalışması gereken robotik sistemler için önemli bir adım teşkil ediyor.
Yapay zeka gerçek dünya karmaşasıyla başa çıkmayı öğreniyor
Araştırmacılar, gerçek dünya ortamlarında sıkça karşılaştığımız geçici engeller ve dikkat dağıtıcı unsurlarla başa çıkabilen yeni bir yapay zeka sistemi geliştirdi. MU-GeNeRF adındaki bu sistem, az sayıda görüntüden üç boyutlu sahne rekonstrüksiyonu yaparken, hareket eden nesneler, geçici engeller ve tutarsız yapılar gibi unsurları ayırt edebiliyor. Geleneksel sistemler bu tür dikkat dağıtıcı unsurları tespit etmekte zorlanıyor ve çoğunlukla sabit yapıları yanlışlıkla engel olarak değerlendiriyordu. Yeni yaklaşım, çok görüş açısından belirsizlik analizi yaparak bu sorunu çözüyor ve daha güvenilir 3D sahne rekonstrüksiyonu sağlıyor. Bu gelişme, artırılmış gerçeklik, robotik navigasyon ve otonom araçlar gibi alanlarda önemli uygulamalara sahip.
Yapay Zeka Robotlarının Çevresel Değişikliklere Adaptasyonu İyileştiriliyor
Görme-Dil-Eylem modellerinde (VLA) yaşanan çevresel değişikliklere karşı kırılganlık sorunu çözüm buluyor. Araştırmacılar, robotların küçük nesne pozisyon değişikliklerinde bile başarısız olma problemini 'yörünge aşırı öğrenme' olarak tanımlıyor. Bu durumda robotlar, eylemler ve nesneler arasındaki sahte korelasyonlara odaklanarak ezberledikleri kalıpları tekrarlıyor. Yeni geliştirilen PDF (Perturbation learning with Delayed Feedback) yöntemi, temel modelde ince ayar yapmadan test zamanında adaptasyon sağlıyor. Bu yaklaşım, belirsizlik tabanlı veri artırma ve eylem oylama ile sahte korelasyonları azaltırken, adaptif bir zamanlayıcı performans-verimlilik dengesini koruyor. Hafif bir pertürbasyon modülü de gecikmeli geri bildirimle eylem güvenilirliğini retrospektif olarak ayarlıyor.
Simetrik Nesneler İçin Yeni Poz Tahmini Yöntemi Geliştirildi
Araştırmacılar, simetrik nesnelerin 3 boyutlu konumlarını tespit etmede karşılaşılan temel zorluklara yenilikçi bir çözüm geliştirdi. Günlük hayatta sıkça karşılaştığımız simetrik nesneler - bardaklar, kutular, silindirler gibi - yapay zeka sistemleri için benzersiz bir zorluk teşkil ediyor. Bu nesnelerin birden fazla görsel açıdan aynı görünmesi, derin öğrenme ağlarının eğitimini zorlaştırıyor. Geleneksel yöntemler bu sorunu özel kayıp fonksiyonları veya karmaşık ağ mimarileri ile çözmeye çalışırken, yeni yaklaşım daha temelden hareket ediyor. SARR adı verilen bu yöntem, rotasyon temsilini matematiksel olarak yeniden tanımlayarak, simetrik nesneler için benzersiz ve sürekli bir poz gösterimi sağlıyor. Bu breakthrough, robotik, artırılmış gerçeklik ve endüstriyel otomasyon alanlarında önemli ilerlemelere kapı açabilir.
Yapay Zeka Görsel Algıda Devrim: Küçük Nesneleri Daha İyi Tanıyan Yeni Sistem
Araştırmacılar, bilgisayar görüsü alanında yaşanan büyük zorluklardan birini çözmeye yönelik yeni bir yapay zeka sistemi geliştirdi. A3-FPN adı verilen bu yenilikçi yaklaşım, görüntülerdeki farklı boyuttaki nesneleri, özellikle küçük detayları tespit etmede mevcut sistemlerden çok daha başarılı sonuçlar veriyor. Sistem, çok katmanlı özellik piramitleri kullanarak görüntüleri farklı ölçeklerde analiz ediyor ve asimptotik çerçeve ile içerik farkında dikkat modüllerini birleştiriyor. Bu teknoloji, otonom araçlardan tıbbi görüntülemeye, güvenlik sistemlerinden endüstriyel kalite kontrolüne kadar birçok alanda kullanılabilir.
Yapay Zeka: Az Veri İle Daha İyi Öğreniyor
Stanford araştırmacıları, yapay zekanın 3D görüntü sentezinde şaşırtıcı bir bulgu ortaya koydu. Minimal 3D bilgi ile çalışan sistemlerin, detaylı 3D verilerle beslenen sistemlerden daha hızlı öğrendiğini keşfettiler. Bu araştırma, 'ne kadar az bağımlı olursanız, o kadar çok öğrenirsiniz' ilkesini ortaya atıyor. Geleneksel yöntemler kamera pozisyonları ve detaylı 3D modeller gerektirirken, yeni yaklaşım sadece seyrek görüntülerden yararlanarak daha etkili sonuçlar üretiyor. Bu keşif, yapay zeka eğitiminde veri kalitesinin nicelikten daha önemli olabileceğini gösteriyor ve gelecekteki AI sistemlerinin tasarımında köklü değişikliklere işaret ediyor.
DeepDetect: Yapay Zeka ile Görsel Analizi Devrim Niteliğinde Yenilik
Bilgisayar görüsü alanında çığır açan yeni bir teknoloji geliştirildi. DeepDetect adlı sistem, görüntülerdeki önemli noktaları tespit etme konusunda klasik yöntemlerle yapay zekayı birleştiriyor. Görüntü analizi, 3D rekonstrüksiyon, robotik navigasyon gibi birçok alanda kullanılan bu teknoloji, geleneksel detektörlerin sınırlarını aşıyor. Araştırmacılar, farklı görsel ipuçlarını bir araya getiren hibrit bir yaklaşım geliştirerek, ışık değişimlerine karşı daha dirençli ve semantik anlayış sahibi bir sistem oluşturdu. Bu yenilik, otonom araçlardan medikal görüntülemeye kadar geniş bir yelpazede uygulanabilir.