Büyük akıl yürütme modelleri karmaşık problemleri çözerken uzun düşünce zincirleri oluşturuyor, ancak bu durum yavaşlık ve yüksek hesaplama maliyetine neden oluyor. Araştırmacılar CoSMo adlı yeni bir framework geliştirerek bu sorunu çözmeyi hedefliyor. Sistem, gereksiz tekrarları birleştirip mantık boşluklarını dolduran akıllı bir algoritma kullanıyor. Böylece modeller daha kısa ama etkili düşünce süreçleriyle aynı başarıya ulaşabiliyor. Bu gelişme, yapay zeka sistemlerinin hem daha hızlı çalışmasını hem de enerji tüketimini azaltmasını sağlayabilir.

arXiv — Hesaplamalı Dilbilim (cs.CL) 0

Teknoloji & Yapay Zeka

21 Apr

Yapay Zeka Modelleri Hangi Düşünce Adımlarının Kritik Olduğunu Biliyor mu?

Büyük dil modelleri karmaşık problemleri çözmek için uzun düşünce zincirleri oluşturur, ancak bu süreçte hangi adımların gerçekten önemli olduğunu ayırt edebiliyorlar mı? Yeni bir araştırma, AI modellerinin dahili olarak her düşünce adımının işlevsel önemini kodlayıp kodlamadığını inceliyor. Araştırmacılar 'açgözlü budama' adını verdikleri yeni bir yöntem geliştirdiler. Bu teknik, modelin genel performansını en az etkileyen düşünce adımlarını tespit ederek sistematik olarak kaldırıyor. Böylece daha kısa ama etkili düşünce zincirleri elde ediliyor. Çalışma, AI modellerinin iç işleyişini anlamada önemli ipuçları sunuyor ve gelecekte daha verimli yapay zeka sistemleri geliştirilmesine katkı sağlayabilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

CRISP: Yapay Zeka Düşünce Zincirlerindeki Gereksiz Adımları Temizleyen Yeni Yöntem

Büyük dil modellerinin karmaşık problemleri çözmek için kullandığı 'düşünce zinciri' yaklaşımı etkili sonuçlar verse de yüksek hesaplama maliyeti getiriyor. Araştırmacılar CRISP adlı yeni bir framework geliştirerek bu soruna çözüm arıyor. Sistem, modelin kendi iç dikkat mekanizmalarını kullanarak hangi düşünce adımlarının kritik, hangilerinin gereksiz olduğunu belirliyor. Özellikle düşünce sürecinin sonunu işaret eden özel tokenların dikkat kalıplarını analiz ederek, mantıksal akışı bozmadan gereksiz kısımları ayıklıyor. Bu yaklaşım, dışarıdan müdahale eden sıkıştırma yöntemlerinin aksine modelin doğal çalışma dinamiklerine uyum sağlayarak kritik mantık adımlarının kaybolmasını önlüyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

21 Apr

Robotlarda Düşünce Zincirleri: Ne Zaman İşe Yarar Ne Zaman Zarar?

Yapay zeka araştırmacıları, robotların görsel algı ve eylem kabiliyetlerini birleştiren modellerde 'düşünce zinciri' yaklaşımının gerçekten faydalı olup olmadığını araştırdı. Chain-of-Thought (CoT) adı verilen bu yöntemde robotlar, eylem almadan önce adım adım mantıklı çıkarımlar yapıyor. Ancak yeni bulgular, bu yaklaşımın her zaman işe yaramadığını ortaya koyuyor. Araştırmacılar, CoT'nin etkili olabilmesi için iki kritik koşulun aynı anda sağlanması gerektiğini keşfetti: farklı veri türlerinin uygun mekanizmalarla işlenmesi ve mantıksal çıkarımların görev başarısıyla nedensel olarak bağlantılı olması. Bu koşullar sağlanmadığında, düşünce zincirleri performansı %4.2 oranında düşürebiliyor ve dağılım kayması durumlarında %32'ye varan başarı düşüşleri yaşanabiliyor.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

20 Apr

Yapay Zeka Gerçekten Nasıl Düşünüyor? Gizli Süreçler vs. Görünen Mantık Zincirleri

Büyük dil modellerinin (LLM) nasıl mantık yürüttüğü konusunda çığır açan bir araştırma, yapay zekanın düşünce sürecinin görünen 'mantık zincirleri'nden ziyade gizli durumlar aracılığıyla gerçekleştiğini öne sürüyor. Stanford ve diğer kurumlardan araştırmacılar, AI'nın problem çözme yeteneğinin açıklanabilirliği, değerlendirilmesi ve geliştirilmesi açısından bu ayrımın kritik önem taşıdığını belirtiyor. Çalışma, yapay zeka sistemlerinin gerçek muhakeme mekanizmalarını anlamamızı köklü şekilde değiştirebilir.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

18 Apr

Yapay zeka modelleri artık akıllıca düşünmeyi öğreniyor: ORBIT sistemi geliyor

Büyük yapay zeka modelleri güçlü performans sergilemek için uzun düşünce zincirleri kullanıyor, ancak bu her zaman gereksiz hesaplama maliyeti yaratıyor. Stanford ve diğer kurumlardan araştırmacılar, yapay zekanın ne kadar 'düşüneceğini' akıllıca belirleyen ORBIT sistemini geliştirdi. Bu yenilikçi yaklaşım, AI modellerinin farklı zorluk seviyelerindeki problemler için en uygun düşünce stratejisini seçmesine olanak tanıyor. Sistem, pekiştirmeli öğrenme kullanarak her çaba seviyesi için en verimli çözüm yollarını keşfediyor ve kullanıcıların maliyet-doğruluk dengesini istedikleri gibi ayarlamalarına imkan veriyor. Bu gelişme, AI sistemlerinin daha verimli ve esnek hale gelmesinde önemli bir adım.

arXiv (CS + AI) 0

Teknoloji & Yapay Zeka

18 Apr

Büyük Dil Modelleri İçin Kritik Düşünme Savunması Geliştirildi

Araştırmacılar, büyük dil modellerinin akıl yürütme süreçlerine yönelik gizli saldırılara karşı yeni bir savunma mekanizması geliştirdi. Critical-CoT adlı bu sistem, modellerin düşünce zincirlerine zararlı adımlar enjekte eden sofistike saldırıları tespit edebiliyor. Geleneksel saldırılar genellikle belirli kelimeleri tetikleyerek modeli yanlış cevap vermeye zorlarken, yeni nesil saldırılar modelin mantıklı görünen ama aslında manipüle edilmiş akıl yürütme süreçleri üretmesini sağlıyor. Bu tür saldırılar, mantıklı görünmeleri nedeniyle tespit edilmesi çok zor. Critical-CoT, iki aşamalı bir ince ayar süreci kullanarak modellere eleştirel düşünme becerileri kazandırıyor ve böylece manipüle edilmiş akıl yürütme adımlarını fark etmelerini sağlıyor. Bu gelişme, yapay zeka güvenliği alanında önemli bir adım olarak değerlendiriliyor.

arXiv (CS + AI) 0