Teknoloji & Yapay Zeka

EasyRider: Yapay Zeka Eğitiminin Elektrik Şebekesine Verdiği Zararı Önlüyor

Binlerce GPU ile büyük ölçekli yapay zeka modeli eğitimleri, elektrik şebekelerini tehdit eden güç dalgalanmalarına neden oluyor. Araştırmacılar, bu sorunu çözmek için EasyRider adlı yeni bir güç mimarisi geliştirdi. GPU'ların eğitim sırasında milisaniyeler içinde maksimum güçten boşta bekleme moduna geçmesi, transformatörlere ve koruma ekipmanlarına zarar verebilecek ani voltaj ve frekans değişikliklerine yol açıyor. EasyRider sistemi, raf seviyesinde pasif bileşenler ve aktif kontrollü yardımcı enerji depolama kullanarak bu güç dalgalanmalarını yumuşatıyor. Sistem, sık şarj/deşarj döngülerinde enerji depolama sisteminin ömrünü maksimize etmek için sürekli izleme yapıyor. Bu teknoloji, yapay zeka altyapısının elektrik şebekesi güvenliği açısından sürdürülebilirliğini artırıyor.

Büyük dil modelleri ve yapay zeka sistemlerinin eğitimi için kullanılan veri merkezleri, elektrik şebekesi altyapısı için beklenmedik bir tehdit oluşturuyor. Binlerce GPU'nun eşzamanlı çalıştığı bu sistemlerde, eğitim süreçleri sırasında yaşanan ani güç değişimleri, elektrik şebekesinde ciddi sorunlara yol açabiliyor.

Araştırmacılar tarafından geliştirilen EasyRider sistemi, bu kritik soruna yenilikçi bir çözüm sunuyor. Yapay zeka modellerinin eğitimi sırasında GPU'lar, senkron iletişim, başlatma, kapatma ve kontrol noktası oluşturma işlemleri esnasında milisaniyeler içinde maksimum güç tüketiminden boşta bekleme moduna geçebiliyor.

Bu hızlı ve büyük güç dalgalanmaları, şebeke altyapısında steep güç artış oranlarına, voltaj ve frekans kaymasına neden oluyor. Ayrıca reaktif güç geçişleri, transformatörlere, dönüştürücülere ve koruma ekipmanlarına kalıcı hasar verebiliyor.

EasyRider mimarisi, raf seviyesinde pasif bileşenler ve aktif kontrollü yardımcı enerji depolama sistemlerini birleştirerek güç dalgalanmalarını etkili şekilde azaltıyor. Yazılım sistemi, enerji depolama sistemini sürekli izleyerek, sık şarj ve deşarj döngüleri karşısında sistemin yaşam süresini optimize ediyor.

Bu teknoloji, veri merkezi güç değişimlerini şebeke güvenlik gereksinimlerini karşılayacak seviyeye filtreliyor ve yapay zeka altyapısının elektrik şebekesiyle uyumlu çalışmasını sağlıyor.

Özgün Kaynak
arXiv (CS + AI)
EasyRider: Mitigating Power Transients in Datacenter-Scale Training Workloads
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.