論文の概要: Robust Model-Free Learning and Control without Prior Knowledge
- arxiv url: http://arxiv.org/abs/2010.00204v1
- Date: Thu, 1 Oct 2020 05:43:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 08:55:15.906549
- Title: Robust Model-Free Learning and Control without Prior Knowledge
- Title(参考訳): 事前知識のないロバストモデルフリー学習と制御
- Authors: Dimitar Ho and John Doyle
- Abstract要約: 本稿では,未知の離散時間線形系を頑健に学習し,安定化するモデルフリー制御アルゴリズムを提案する。
コントローラはシステムダイナミクス、障害、ノイズに関する事前の知識を必要としない。
一般化と簡易性にもかかわらず、制御器はクローズドループ性能がよいことを示すシミュレーション結果で結論を下す。
- 参考スコア(独自算出の注目度): 1.14219428942199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a simple model-free control algorithm that is able to robustly
learn and stabilize an unknown discrete-time linear system with full control
and state feedback subject to arbitrary bounded disturbance and noise
sequences. The controller does not require any prior knowledge of the system
dynamics, disturbances, or noise, yet it can guarantee robust stability and
provides asymptotic and worst-case bounds on the state and input trajectories.
To the best of our knowledge, this is the first model-free algorithm that comes
with such robust stability guarantees without the need to make any prior
assumptions about the system. We would like to highlight the new convex
geometry-based approach taken towards robust stability analysis which served as
a key enabler in our results. We will conclude with simulation results that
show that despite the generality and simplicity, the controller demonstrates
good closed-loop performance.
- Abstract(参考訳): 本稿では,任意の有界外乱やノイズシーケンスを条件とした,未知の離散時間線形システムの完全制御と状態フィードバックを頑健に学習し,安定化する,シンプルなモデル自由制御アルゴリズムを提案する。
コントローラはシステムのダイナミクスや外乱、ノイズに関する事前の知識を必要としないが、堅牢な安定性を保証でき、状態や入力トラジェクタに対する漸近的かつ最悪の境界を提供する。
私たちの知る限りでは、このアルゴリズムはシステムに関する事前の仮定をすることなく、堅牢な安定性を保証する最初のモデルフリーなアルゴリズムである。
我々は, 安定解析に向け, 凸幾何学に基づく新しいアプローチを強調し, 結果の重要な有効要因となった。
一般化と簡易性にもかかわらず、制御器はクローズドループ性能がよいことを示すシミュレーション結果で結論付ける。
関連論文リスト
- Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Bayesian Algorithms Learn to Stabilize Unknown Continuous-Time Systems [0.0]
線形力学系は、不確実な力学を持つ植物の学習に基づく制御のための標準モデルである。
この目的のための信頼性の高い安定化手順は、不安定なデータから有効に学習し、有限時間でシステムを安定化させることができない。
本研究では,未知の連続時間線形系を安定化する新しい学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-30T15:31:35Z) - Stabilizing Dynamical Systems via Policy Gradient Methods [32.88312419270879]
完全に観察された力学系を安定化するためのモデルフリーなアルゴリズムを提案する。
本研究では,線形システムの安定化制御を効率よく行うことを証明する。
我々は,共通制御ベンチマークにおけるアプローチの有効性を実証的に評価した。
論文 参考訳(メタデータ) (2021-10-13T00:58:57Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Sliding Mode Learning Control of Uncertain Nonlinear Systems with
Lyapunov Stability Analysis [3.2996723916635267]
スライディングモード学習アルゴリズムの安定性は文献で証明された。
全体のシステムの安定性は n 次不確定非線形系に対して証明される。
SMLCアルゴリズムは、数学的モデル知識がなければシステムの振る舞いを学習することができる。
論文 参考訳(メタデータ) (2021-03-21T01:03:04Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Learning Stabilizing Controllers for Unstable Linear Quadratic
Regulators from a Single Trajectory [85.29718245299341]
線形2次制御器(LQR)としても知られる2次コストモデルの下で線形制御器を研究する。
楕円形不確実性集合内の全ての系を安定化させる制御器を構成する2つの異なる半定値プログラム(SDP)を提案する。
高い確率で安定化コントローラを迅速に識別できる効率的なデータ依存アルゴリズムであるtextsceXplorationを提案する。
論文 参考訳(メタデータ) (2020-06-19T08:58:57Z) - Fine-Grained Analysis of Stability and Generalization for Stochastic
Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。
これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。
我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文 参考訳(メタデータ) (2020-06-15T06:30:19Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。