論文の概要: Learning the Uncertainty Sets for Control Dynamics via Set Membership: A
Non-Asymptotic Analysis
- arxiv url: http://arxiv.org/abs/2309.14648v1
- Date: Tue, 26 Sep 2023 03:58:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 15:04:07.656710
- Title: Learning the Uncertainty Sets for Control Dynamics via Set Membership: A
Non-Asymptotic Analysis
- Title(参考訳): 集合メンバシップによる制御ダイナミクスの不確実性セットの学習:非漸近解析
- Authors: Yingying Li, Jing Yu, Lauren Conger, Adam Wierman
- Abstract要約: 本稿では,集合メンバシップ推定によって生成される不確実性集合の直径に非漸近的境界を与える。
これは、集合メンバシップによって更新された不確実性セットによるロバスト適応モデル予測制御に適用される。
- 参考スコア(独自算出の注目度): 21.02041201645763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Set-membership estimation is commonly used in adaptive/learning-based control
algorithms that require robustness over the model uncertainty sets, e.g.,
online robustly stabilizing control and robust adaptive model predictive
control. Despite having broad applications, non-asymptotic estimation error
bounds in the stochastic setting are limited. This paper provides such a
non-asymptotic bound on the diameter of the uncertainty sets generated by set
membership estimation on linear dynamical systems under bounded, i.i.d.
disturbances. Further, this result is applied to robust adaptive model
predictive control with uncertainty sets updated by set membership. We
numerically demonstrate the performance of the robust adaptive controller,
which rapidly approaches the performance of the offline optimal model
predictive controller, in comparison with the control design based on least
square estimation's confidence regions.
- Abstract(参考訳): 集合メンバシップ推定は、オンラインのロバスト安定化制御やロバスト適応モデル予測制御など、モデルの不確実性セットに対して堅牢性を必要とする適応/学習ベースの制御アルゴリズムで一般的に使用される。
広く応用されているにもかかわらず、確率的設定における非漸近的推定誤差境界は限定的である。
本稿では, 線形力学系に対する集合メンバシップ推定によって生じる不確実集合の直径の非漸近的境界,すなわち外乱について述べる。
さらに、不確実性セットをセットメンバシップで更新したロバスト適応モデル予測制御に適用する。
我々は,オフライン最適モデル予測コントローラの性能に素早く接近するロバスト適応制御器の性能を,最小二乗推定の信頼領域に基づく制御設計と比較して数値的に示す。
関連論文リスト
- Actively Learning Reinforcement Learning: A Stochastic Optimal Control
Approach [3.7728340443952577]
提案する枠組みは,2つある: (i) 活発な探索と意図的な情報収集を伴う強化学習, (i) ミスマッチのモデル化による状態と不確実性を制御し, (ii) 最適制御の膨大な計算コストを克服する。
我々は、強化学習を用いて最適制御法を達成することにより、両方の目的にアプローチする。
論文 参考訳(メタデータ) (2023-09-18T18:05:35Z) - Adaptive Robust Model Predictive Control via Uncertainty Cancellation [25.736296938185074]
本稿では,動的に重要な不確かさを補う学習に基づく頑健な予測制御アルゴリズムを提案する。
我々は、一定の等価な「推定とキャンセル」制御法に着想を得た、非線形フィードバックポリシーのクラスを最適化する。
論文 参考訳(メタデータ) (2022-12-02T18:54:23Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Adaptive Model Predictive Control by Learning Classifiers [26.052368583196426]
制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
論文 参考訳(メタデータ) (2022-03-13T23:22:12Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Adaptive Robust Model Predictive Control with Matched and Unmatched
Uncertainty [28.10549712956161]
離散時間系のダイナミクスにおける大きな不確実性を扱うことができる学習ベースの堅牢な予測制御アルゴリズムを提案する。
既存の学習に基づく予測制御アルゴリズムが大規模な不確実性が存在する場合の安全性を確保することができず、性能が大幅に向上する。
論文 参考訳(メタデータ) (2021-04-16T17:47:02Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Reinforcement Learning for Safety-Critical Control under Model
Uncertainty, using Control Lyapunov Functions and Control Barrier Functions [96.63967125746747]
強化学習フレームワークは、CBFおよびCLF制約に存在するモデル不確実性を学ぶ。
RL-CBF-CLF-QPは、安全制約におけるモデル不確実性の問題に対処する。
論文 参考訳(メタデータ) (2020-04-16T10:51:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Robust Learning-Based Control via Bootstrapped Multiplicative Noise [0.0]
本稿では,このような非漸近的不確かさを制御設計に明示的に組み込む頑健な適応制御アルゴリズムを提案する。
提案手法の主な利点は、システム識別とロバストな制御設計手順の両方が不確実性表現を使用することである。
論文 参考訳(メタデータ) (2020-02-24T04:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。