論文の概要: React to Surprises: Stable-by-Design Neural Feedback Control and the Youla-REN
- arxiv url: http://arxiv.org/abs/2506.01226v2
- Date: Wed, 04 Jun 2025 01:56:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 13:54:39.517026
- Title: React to Surprises: Stable-by-Design Neural Feedback Control and the Youla-REN
- Title(参考訳): Reactが予想される: 安定して設計したニューラルフィードバックコントロールとYoula-REN
- Authors: Nicholas H. Barbara, Ruigang Wang, Alexandre Megretski, Ian R. Manchester,
- Abstract要約: 学習に基づく制御のための非線形ポリシーの安定化のパラメータ化について検討する。
本稿では,ユラ・クーラパラメータ化の非線形バージョンとロバストニューラルネットワークを組み合わせた構造を提案する。
- 参考スコア(独自算出の注目度): 43.988843102040725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study parameterizations of stabilizing nonlinear policies for learning-based control. We propose a structure based on a nonlinear version of the Youla-Kucera parameterization combined with robust neural networks such as the recurrent equilibrium network (REN). The resulting parameterizations are unconstrained, and hence can be searched over with first-order optimization methods, while always ensuring closed-loop stability by construction. We study the combination of (a) nonlinear dynamics, (b) partial observation, and (c) incremental closed-loop stability requirements (contraction and Lipschitzness). We find that with any two of these three difficulties, a contracting and Lipschitz Youla parameter always leads to contracting and Lipschitz closed loops. However, if all three hold, then incremental stability can be lost with exogenous disturbances. Instead, a weaker condition is maintained, which we call d-tube contraction and Lipschitzness. We further obtain converse results showing that the proposed parameterization covers all contracting and Lipschitz closed loops for certain classes of nonlinear systems. Numerical experiments illustrate the utility of our parameterization when learning controllers with built-in stability certificates for: (i) "economic" rewards without stabilizing effects; (ii) short training horizons; and (iii) uncertain systems.
- Abstract(参考訳): 学習に基づく制御のための非線形ポリシーの安定化のパラメータ化について検討する。
本稿では、Youla-Kuceraパラメータ化の非線形バージョンと、Recurrent equilibrium Network (REN)のような堅牢なニューラルネットワークを組み合わせた構造を提案する。
結果のパラメータ化は制約がなく、従って一階最適化法で探索することができる。
我々は組み合わせについて研究する
(a)非線形力学,
b)部分観察,および
(c)増分閉ループ安定性要件(抽出とリプシッツネス)。
これら3つの困難のうちのいずれかの2つで、収縮とリプシッツユーラパラメータが常に収縮とリプシッツ閉ループにつながることが分かる。
しかし、これら3つを全て保持すると、漸進安定性は外因性障害によって失われる。
代わりに、d-チューブ収縮とリプシッツネスと呼ばれるより弱い状態が維持される。
さらに、ある非線形系のクラスに対して、提案されたパラメータ化が全ての収縮とリプシッツ閉ループをカバーすることを示す逆結果を得る。
数値実験は, 安定度証明を組み込んだ制御器の学習におけるパラメータ化の有用性を例証する。
一 効果を安定させることなく「経済的」報酬
(二 短期訓練地平線
(三)不確実な制度
関連論文リスト
- Learning Over Contracting and Lipschitz Closed-Loops for
Partially-Observed Nonlinear Systems (Extended Version) [1.2430809884830318]
本稿では非線形な部分観測力学系に対する学習に基づく制御のためのポリシーパラメータ化を提案する。
結果のYoula-RENパラメータ化は自動的に安定性(収縮)とユーザチューニング可能な堅牢性(Lipschitz)を満足することを示した。
We found that the Youla-REN are also like to existing learning-based and optimal control method, also ensure stability and exhibiting improve robustness to adversarial disturbances。
論文 参考訳(メタデータ) (2023-04-12T23:55:56Z) - KCRL: Krasovskii-Constrained Reinforcement Learning with Guaranteed
Stability in Nonlinear Dynamical Systems [66.9461097311667]
形式的安定性を保証するモデルに基づく強化学習フレームワークを提案する。
提案手法は,特徴表現を用いて信頼区間までシステムダイナミクスを学習する。
我々は、KCRLが、基礎となる未知のシステムとの有限数の相互作用において安定化ポリシーを学ぶことが保証されていることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:27:04Z) - Neural System Level Synthesis: Learning over All Stabilizing Policies
for Nonlinear Systems [0.0]
本稿では,パラメータ最適化における閉ループ安定性を保証するニューラルSLS(Neur-SLS)手法を提案する。
本稿では,Recurrent Equilibrium Networks (RENs) に基づく最近のDeep Neural Network (DNN) モデルを用いて,非線形安定演算子の豊富なクラスについて学習する。
論文 参考訳(メタデータ) (2022-03-22T15:22:31Z) - Youla-REN: Learning Nonlinear Feedback Policies with Robust Stability
Guarantees [5.71097144710995]
本稿では,最近開発されたニューラルネットワークアーキテクチャ上に構築された不確実性システムに対する非線形制御器のパラメータ化について述べる。
提案したフレームワークは、安定性の保証、すなわち、検索空間におけるすべてのポリシーが、契約(グローバルに指数関数的に安定した)クローズドループシステムをもたらすことを保証する。
論文 参考訳(メタデータ) (2021-12-02T13:52:37Z) - Robust Implicit Networks via Non-Euclidean Contractions [63.91638306025768]
暗黙のニューラルネットワークは、精度の向上とメモリ消費の大幅な削減を示す。
彼らは不利な姿勢と収束の不安定さに悩まされる。
本論文は,ニューラルネットワークを高機能かつ頑健に設計するための新しい枠組みを提供する。
論文 参考訳(メタデータ) (2021-06-06T18:05:02Z) - Concurrent Learning Based Tracking Control of Nonlinear Systems using
Gaussian Process [2.7930955543692817]
本稿では,パラメータ推定ツールとしての並列学習と,オンライン外乱学習における非パラメトリックガウス過程の適用性を示す。
制御法則は、フィードバック線形化の文脈において、両方の手法を逐次的に用いて開発される。
n階系の閉ループ系安定性はリャプノフ安定性定理を用いて証明される。
論文 参考訳(メタデータ) (2021-06-02T02:59:48Z) - Improper Learning with Gradient-based Policy Optimization [62.50997487685586]
未知のマルコフ決定過程に対して学習者がmベースコントローラを与えられる不適切な強化学習設定を考える。
制御器の不適切な混合のクラス上で動作する勾配に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T14:53:55Z) - Lipschitz Recurrent Neural Networks [100.72827570987992]
我々のリプシッツ再帰ユニットは、他の連続時間RNNと比較して、入力やパラメータの摂動に対してより堅牢であることを示す。
実験により,Lipschitz RNNは,ベンチマークタスクにおいて,既存のリカレントユニットよりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-06-22T08:44:52Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。