論文の概要: Synthesis of Stabilizing Recurrent Equilibrium Network Controllers
- arxiv url: http://arxiv.org/abs/2204.00122v1
- Date: Thu, 31 Mar 2022 22:27:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-05 01:49:12.512653
- Title: Synthesis of Stabilizing Recurrent Equilibrium Network Controllers
- Title(参考訳): 安定化リカレント平衡ネットワークコントローラの合成
- Authors: Neelay Junnarkar, He Yin, Fangda Gu, Murat Arcak, Peter Seiler
- Abstract要約: 本稿では、リカレントニューラルネットワークの一般化であるリカレント平衡ネットワークに基づく非線形動的コントローラのパラメータ化を提案する。
制御器がセクター有界非線形性を持つ部分観察された力学系の指数的安定性を保証するパラメータ化に関する制約を導出する。
本稿では,任意の構造を持つ報酬関数を最大化するために,予測ポリシ勾配法を用いてこの制御器を合成する手法を提案する。
- 参考スコア(独自算出の注目度): 1.3799488979862031
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a parameterization of a nonlinear dynamic controller based on the
recurrent equilibrium network, a generalization of the recurrent neural
network. We derive constraints on the parameterization under which the
controller guarantees exponential stability of a partially observed dynamical
system with sector-bounded nonlinearities. Finally, we present a method to
synthesize this controller using projected policy gradient methods to maximize
a reward function with arbitrary structure. The projection step involves the
solution of convex optimization problems. We demonstrate the proposed method
with simulated examples of controlling nonlinear plants, including plants
modeled with neural networks.
- Abstract(参考訳): 本稿では、リカレントニューラルネットワークの一般化であるリカレント平衡ネットワークに基づく非線形動的コントローラのパラメータ化を提案する。
制御器がセクター有界非線形性を持つ部分観測力学系の指数的安定性を保証するパラメータ化に関する制約を導出する。
最後に,任意の構造で報奨関数を最大化するために,投影されたポリシー勾配法を用いてこの制御器を合成する手法を提案する。
射影ステップは凸最適化問題の解を含む。
ニューラルネットワークをモデルとした植物を含む非線形プラントの制御のシミュレーション例を用いて,提案手法を実証した。
関連論文リスト
- Neural Port-Hamiltonian Models for Nonlinear Distributed Control: An Unconstrained Parametrization Approach [0.0]
ニューラルネットワーク(NN)は、優れたパフォーマンスをもたらす制御ポリシのパラメータ化に利用することができる。
NNの小さな入力変更に対する感度は、クローズドループシステムの不安定化のリスクを引き起こす。
これらの問題に対処するために、ポート・ハミルトンシステムのフレームワークを活用して、連続時間分散制御ポリシーを設計する。
提案する分散コントローラの有効性は,非ホロノミック移動ロボットのコンセンサス制御によって実証される。
論文 参考訳(メタデータ) (2024-11-15T10:44:29Z) - Synthesizing Neural Network Controllers with Closed-Loop Dissipativity Guarantees [0.6612847014373572]
植物のクラスは、不確実性と相互接続された線形時間不変系(LTI)と見なされる。
プラントの不確かさとニューラルネットワークの非線形性は、どちらも積分二次的制約を用いて記述される。
凸条件はプロジェクションベースのトレーニング手法で、解離性を保証するニューラルネットワークコントローラを合成するために用いられる。
論文 参考訳(メタデータ) (2024-04-10T22:15:28Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Neural System Level Synthesis: Learning over All Stabilizing Policies
for Nonlinear Systems [0.0]
本稿では,パラメータ最適化における閉ループ安定性を保証するニューラルSLS(Neur-SLS)手法を提案する。
本稿では,Recurrent Equilibrium Networks (RENs) に基づく最近のDeep Neural Network (DNN) モデルを用いて,非線形安定演算子の豊富なクラスについて学習する。
論文 参考訳(メタデータ) (2022-03-22T15:22:31Z) - Learning over All Stabilizing Nonlinear Controllers for a
Partially-Observed Linear System [4.3012765978447565]
線形力学系に対する非線形出力フィードバックコントローラのパラメータ化を提案する。
提案手法は, 制約を満たすことなく, 部分的に観測可能な線形力学系の閉ループ安定性を保証する。
論文 参考訳(メタデータ) (2021-12-08T10:43:47Z) - Deep Learning Approximation of Diffeomorphisms via Linear-Control
Systems [91.3755431537592]
我々は、制御に線形に依存する$dot x = sum_i=1lF_i(x)u_i$という形の制御系を考える。
対応するフローを用いて、コンパクトな点のアンサンブル上の微分同相写像の作用を近似する。
論文 参考訳(メタデータ) (2021-10-24T08:57:46Z) - Linear systems with neural network nonlinearities: Improved stability
analysis via acausal Zames-Falb multipliers [0.0]
ニューラルネットワークの非線形性を考慮した線形時間不変系のフィードバック相互干渉の安定性を離散時間で解析する。
このアプローチは、ニューラルネットワークの非線形性とフィードバック相互接続の安定性解析のための柔軟で汎用的なフレームワークを提供する。
論文 参考訳(メタデータ) (2021-03-31T14:21:03Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - Neural Control Variates [71.42768823631918]
ニューラルネットワークの集合が、積分のよい近似を見つけるという課題に直面していることを示す。
理論的に最適な分散最小化損失関数を導出し、実際に安定したオンライントレーニングを行うための代替の複合損失を提案する。
具体的には、学習した光場近似が高次バウンスに十分な品質であることを示し、誤差補正を省略し、無視可能な可視バイアスのコストでノイズを劇的に低減できることを示した。
論文 参考訳(メタデータ) (2020-06-02T11:17:55Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。