Teknoloji & Yapay Zeka

Yapay Zeka ile Sürekli Zamanlı Kontrol Sistemleri: Veri Tabanlı Yeni Yaklaşım

Araştırmacılar, sürekli zamanlı kontrol sistemlerinin optimizasyonu için veri tabanlı yeni bir yaklaşım geliştirdiler. Linear Quadratic Regulator (LQR) problemi olarak bilinen bu alanda, kapalı döngü ve takviyeli öğrenme parametrizasyonlarını kullanan iki farklı yöntem önerildi. Bu çalışma, robotik, otonom araçlar ve endüstriyel otomasyon gibi alanlarda kritik önem taşıyan kontrol sistemlerinin daha etkili şekilde tasarlanmasına olanak sağlıyor. Özellikle sürekli zamanlı sistemler için geliştirilen bu yaklaşımlar, geleneksel yöntemlere göre daha esnek ve uyarlanabilir çözümler sunuyor.

Kontrol teorisinin en önemli problemlerinden biri olan Linear Quadratic Regulator (LQR) optimizasyonu için yeni bir veri tabanlı yaklaşım geliştirildi. Bu çalışma, sürekli zamanlı sistemlerin kontrolünde devrim niteliğinde iki farklı parametrizasyon yöntemi sunuyor.

İlk yaklaşım, davranışsal sistem teorisinden alınan kapalı döngü (CL) parametrizasyonunu kullanıyor. Bu yöntem, kapalı döngü sistemini eşitlik kısıtlamalarını sağlayan bir matris aracılığıyla karakterize ediyor. Araştırmacılar, daha önce ayrık zamanlı sistemlerde kullanılan bu yaklaşımı sürekli zamanlı ortama uyarlayarak, politika iterasyonu şeması geliştirdiler ve veri tabanlı sürekli zamanlı cebirsel Riccati denklemi türettiler.

İkinci yaklaşım ise integral takviyeli öğrenme (IRL) parametrizasyonunu temel alıyor. Bu yöntem, off-policy veri kullanarak politika değerlendirmesi yapıyor ve ardından bu değerlendirmeyi politika iterasyonu veya değer iterasyonu için kullanıyor. IRL çerçevesinde araştırmacılar, politika gradyan akışı türeterek LQR probleminin konveks yeniden formülasyonlarını önerdiler.

Bu gelişmeler, robotik kontrolünden otonom araçlara, endüstriyel otomasyondan havacılık sistemlerine kadar geniş bir uygulama yelpazesinde daha verimli ve uyarlanabilir kontrol sistemlerinin tasarlanmasını mümkün kılıyor.

Özgün Kaynak
arXiv — Bilgisayar Sistemleri
Data-Driven Continuous-Time Linear Quadratic Regulator via Closed-Loop and Reinforcement Learning Parameterizations
Orijinal makaleyi oku

Bu içerik, özgün kaynaktaki bilgiler temel alınarak BilimKapsül editörleri tarafından yeniden kaleme alınmıştır. Orijinal metnin birebir çevirisi değildir. Telif hakkı özgün yayıncıya aittir.