論文の概要: Contraction $\mathcal{L}_1$-Adaptive Control using Gaussian Processes
- arxiv url: http://arxiv.org/abs/2009.03864v2
- Date: Tue, 30 Nov 2021 18:33:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 21:44:25.249448
- Title: Contraction $\mathcal{L}_1$-Adaptive Control using Gaussian Processes
- Title(参考訳): ガウス過程を用いた契約$\mathcal{L}_1$-Adaptive Control
- Authors: Aditya Gahlawat, Arun Lakshmanan, Lin Song, Andrew Patterson, Zhuohuan
Wu, Naira Hovakimyan, Evangelos Theodorou
- Abstract要約: 本稿では,不確実性のあるシステムに対して,安全な同時学習と制御を可能にする制御フレームワークを提案する。
2つの主要な構成要素は収縮理論に基づく制御とベイズ学習である。
各種環境における平面四元数系の安全な学習と制御の例を示す。
- 参考スコア(独自算出の注目度): 13.03830592825586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present $\mathcal{CL}_1$-$\mathcal{GP}$, a control framework that enables
safe simultaneous learning and control for systems subject to uncertainties.
The two main constituents are contraction theory-based $\mathcal{L}_1$
($\mathcal{CL}_1$) control and Bayesian learning in the form of Gaussian
process (GP) regression. The $\mathcal{CL}_1$ controller ensures that control
objectives are met while providing safety certificates. Furthermore,
$\mathcal{CL}_1$-$\mathcal{GP}$ incorporates any available data into a GP model
of uncertainties, which improves performance and enables the motion planner to
achieve optimality safely. This way, the safe operation of the system is always
guaranteed, even during the learning transients. We provide a few illustrative
examples for the safe learning and control of planar quadrotor systems in a
variety of environments.
- Abstract(参考訳): 我々は,不確実性のあるシステムに対して,安全な同時学習と制御を可能にする制御フレームワークである$\mathcal{CL}_1$-$\mathcal{GP}$を提案する。
2つの主要な構成成分は、収縮理論に基づく$\mathcal{L}_1$(\mathcal{CL}_1$)制御とガウス過程(GP)回帰の形でのベイズ学習である。
$\mathcal{cl}_1$コントローラは、安全証明書の提供中に制御目標が満たされることを保証する。
さらに、$\mathcal{CL}_1$-$\mathcal{GP}$は、任意の利用可能なデータを不確実性のGPモデルに組み込む。
このようにして、学習過渡期においても、システムの安全な操作が常に保証される。
様々な環境における平面四重項系の安全な学習と制御のためのいくつかの例を示す。
関連論文リスト
- Linear quadratic control of nonlinear systems with Koopman operator learning and the Nyström method [16.0198373552099]
計算量を大幅に削減するために,ランダムな部分空間をどのように利用できるかを示す。
我々の主な技術的貢献は、Nystr"om近似の効果に関する理論的保証を導出することである。
論文 参考訳(メタデータ) (2024-03-05T09:28:40Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Safe Adaptive Learning-based Control for Constrained Linear Quadratic
Regulators with Regret Guarantees [11.627320138064684]
本研究では,2次コスト関数を持つ未知の線形系の状態・動作の安全性制約を考慮した適応制御について検討する。
本アルゴリズムは単一軌道上に実装されており,システム再起動を必要としない。
論文 参考訳(メタデータ) (2021-10-31T05:52:42Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Improper Learning for Non-Stochastic Control [78.65807250350755]
逆方向の摂動, 逆方向に選択された凸損失関数, 部分的に観察された状態を含む, 未知の線形力学系を制御することの問題点を考察する。
このパラメトリゼーションにオンライン降下を適用することで、大規模なクローズドループポリシーに対してサブリニア後悔を実現する新しいコントローラが得られる。
我々の境界は、線形力学コントローラの安定化と競合する非確率的制御設定における最初のものである。
論文 参考訳(メタデータ) (2020-01-25T02:12:48Z) - Infinite-Horizon Differentiable Model Predictive Control [11.23458396295289]
本稿では,安全な模倣学習のための微分線形2次モデル予測制御(MPC)フレームワークを提案する。
このフレームワークの学習能力は、数値的な研究のセットで実証されている。
論文 参考訳(メタデータ) (2020-01-07T19:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。