論文の概要: Robust Learning-Based Control via Bootstrapped Multiplicative Noise
- arxiv url: http://arxiv.org/abs/2002.10069v3
- Date: Wed, 11 Aug 2021 22:21:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 03:46:07.589460
- Title: Robust Learning-Based Control via Bootstrapped Multiplicative Noise
- Title(参考訳): ブートストラップ型乗法雑音によるロバスト学習制御
- Authors: Benjamin Gravell and Tyler Summers
- Abstract要約: 本稿では,このような非漸近的不確かさを制御設計に明示的に組み込む頑健な適応制御アルゴリズムを提案する。
提案手法の主な利点は、システム識別とロバストな制御設計手順の両方が不確実性表現を使用することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite decades of research and recent progress in adaptive control and
reinforcement learning, there remains a fundamental lack of understanding in
designing controllers that provide robustness to inherent non-asymptotic
uncertainties arising from models estimated with finite, noisy data. We propose
a robust adaptive control algorithm that explicitly incorporates such
non-asymptotic uncertainties into the control design. The algorithm has three
components: (1) a least-squares nominal model estimator; (2) a bootstrap
resampling method that quantifies non-asymptotic variance of the nominal model
estimate; and (3) a non-conventional robust control design method using an
optimal linear quadratic regulator (LQR) with multiplicative noise. A key
advantage of the proposed approach is that the system identification and robust
control design procedures both use stochastic uncertainty representations, so
that the actual inherent statistical estimation uncertainty directly aligns
with the uncertainty the robust controller is being designed against. We show
through numerical experiments that the proposed robust adaptive controller can
significantly outperform the certainty equivalent controller on both expected
regret and measures of regret risk.
- Abstract(参考訳): 数十年にわたる研究と最近の適応制御と強化学習の進歩にもかかわらず、有限なノイズデータで推定されたモデルから生じる固有の非漸近的不確実性に対する堅牢性を提供するコントローラの設計には、基本的な理解の欠如が残っている。
本稿では,このような非漸近的不確かさを制御設計に明示的に組み込む頑健な適応制御アルゴリズムを提案する。
このアルゴリズムは,(1)最小二乗モデル推定器,(2)名目モデル推定の非漸近的分散を定量化するブートストラップ再サンプリング法,(3)乗算雑音を持つ最適線形二次制御器(LQR)を用いた非従来型ロバストな制御設計法,の3成分を有する。
提案手法の重要な利点は、システム同定とロバスト制御設計手順の両方が確率的不確かさ表現を用いており、実際の固有統計推定の不確実性はロバストコントローラが設計している不確実性と直接一致することである。
提案するロバスト適応制御器は, 期待された後悔と後悔のリスクの尺度の両方において, 確実性同等の制御器を著しく上回ることができることを示す。
関連論文リスト
- Learning the Uncertainty Sets for Control Dynamics via Set Membership: A
Non-Asymptotic Analysis [21.02041201645763]
本稿では,集合メンバシップ推定によって生成される不確実性集合の直径に非漸近的境界を与える。
これは、集合メンバシップによって更新された不確実性セットによるロバスト適応モデル予測制御に適用される。
論文 参考訳(メタデータ) (2023-09-26T03:58:06Z) - Actively Learning Reinforcement Learning: A Stochastic Optimal Control
Approach [3.7728340443952577]
提案する枠組みは,2つある: (i) 活発な探索と意図的な情報収集を伴う強化学習, (i) ミスマッチのモデル化による状態と不確実性を制御し, (ii) 最適制御の膨大な計算コストを克服する。
我々は、強化学習を用いて最適制御法を達成することにより、両方の目的にアプローチする。
論文 参考訳(メタデータ) (2023-09-18T18:05:35Z) - Adaptive Robust Model Predictive Control via Uncertainty Cancellation [25.736296938185074]
本稿では,動的に重要な不確かさを補う学習に基づく頑健な予測制御アルゴリズムを提案する。
我々は、一定の等価な「推定とキャンセル」制御法に着想を得た、非線形フィードバックポリシーのクラスを最適化する。
論文 参考訳(メタデータ) (2022-12-02T18:54:23Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Robust Data-Driven Output Feedback Control via Bootstrapped
Multiplicative Noise [1.0312968200748118]
本稿では,データ駆動型出力フィードバック制御アルゴリズムを提案する。
提案手法の主な利点は、システム識別とロバストな制御設計手順の両方が不確実性表現を使用することである。
提案したロバストなデータ駆動型出力フィードバック制御器は,数値実験により,一定の等価な制御器を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2022-05-10T18:47:14Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - A Regret Minimization Approach to Iterative Learning Control [61.37088759497583]
我々は、標準的な不確実性の仮定を最悪の場合の後悔に置き換える新しいパフォーマンスメトリック、計画後悔を提案します。
提案アルゴリズムがいくつかのベンチマークで既存の手法よりも優れているという理論的および実証的な証拠を提供します。
論文 参考訳(メタデータ) (2021-02-26T13:48:49Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。