論文の概要: Adaptive Robust Model Predictive Control with Matched and Unmatched
Uncertainty
- arxiv url: http://arxiv.org/abs/2104.08261v1
- Date: Fri, 16 Apr 2021 17:47:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 14:08:31.176514
- Title: Adaptive Robust Model Predictive Control with Matched and Unmatched
Uncertainty
- Title(参考訳): 一致不確かさを考慮した適応ロバストモデル予測制御
- Authors: Rohan Sinha, James Harrison, Spencer M. Richards, Marco Pavone
- Abstract要約: 離散時間系のダイナミクスにおける大きな不確実性を扱うことができる学習ベースの堅牢な予測制御アルゴリズムを提案する。
既存の学習に基づく予測制御アルゴリズムが大規模な不確実性が存在する場合の安全性を確保することができず、性能が大幅に向上する。
- 参考スコア(独自算出の注目度): 28.10549712956161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a learning-based robust predictive control algorithm that can
handle large uncertainty in the dynamics for a class of discrete-time systems
that are nominally linear with an additive nonlinear dynamics component. Such
systems commonly model the nonlinear effects of an unknown environment on a
nominal system. Motivated by an inability of existing learning-based predictive
control algorithms to achieve safety guarantees in the presence of
uncertainties of large magnitude in this setting, we achieve significant
performance improvements by optimizing over a novel class of nonlinear feedback
policies inspired by certainty equivalent "estimate-and-cancel" control laws
pioneered in classical adaptive control. In contrast with previous work in
robust adaptive MPC, this allows us to take advantage of the structure in the a
priori unknown dynamics that are learned online through function approximation.
Our approach also extends typical nonlinear adaptive control methods to systems
with state and input constraints even when an additive uncertain function
cannot directly be canceled from the dynamics. Moreover, our approach allows us
to apply contemporary statistical estimation techniques to certify the safety
of the system through persistent constraint satisfaction with high probability.
We show that our method allows us to consider larger unknown terms in the
dynamics than existing methods through simulated examples.
- Abstract(参考訳): 非線形力学成分を付加的に線形とする離散時間系の力学における大きな不確実性を扱う学習ベースのロバスト予測制御アルゴリズムを提案する。
このようなシステムは通常、未知の環境の非線形効果を名目システム上でモデル化する。
従来の学習に基づく予測制御アルゴリズムでは,大規模な不確実性が存在する場合の安全性保証が得られないため,従来の適応制御法に先立ち,一定の等価な「推定」制御法に着想を得た,新しい非線形フィードバックポリシーのクラスを最適化することにより,大幅な性能向上を実現している。
従来のロバスト適応型mpcの研究とは対照的に、これは関数近似によってオンラインで学習される事前未知ダイナミクスの構造を利用することができる。
また, 非線形適応制御法を, 加法的な不確かさ関数をダイナミクスから直接取り消すことができない場合でも, 状態制約や入力制約のあるシステムにも拡張する。
さらに,本手法では,確率の高い持続的制約満足度を通じて,システムの安全性を証明するために,現代の統計的推定手法を適用することができる。
本手法は, シミュレーション例を用いて, 従来の手法よりも大きな未知項を動的に考えることができることを示す。
関連論文リスト
- Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Online Nonstochastic Model-Free Reinforcement Learning [35.377261344335736]
本研究では,動的あるいは敵対的な環境に対するロバストモデルロバスト性保証について検討する。
これらのポリシーを最適化するための効率的かつ効率的なアルゴリズムを提供する。
これらは状態空間に依存せず、状態空間に依存しない最もよく知られた発展である。
論文 参考訳(メタデータ) (2023-05-27T19:02:55Z) - Statistical Safety and Robustness Guarantees for Feedback Motion
Planning of Unknown Underactuated Stochastic Systems [1.0323063834827415]
本研究では, 平均力学モデルを用いたサンプリングベースプランナを提案し, 学習外乱境界による閉ループ追従誤差を同時に有界化する。
この保証は,10次元四角形ロボットのシミュレーションや,クレージーフライ四角形ロボットとクリアパスジャカルロボットの現実世界でのシミュレーションにおいて,経験的安全性に変換されることを検証した。
論文 参考訳(メタデータ) (2022-12-13T19:38:39Z) - Adaptive Robust Model Predictive Control via Uncertainty Cancellation [25.736296938185074]
本稿では,動的に重要な不確かさを補う学習に基づく頑健な予測制御アルゴリズムを提案する。
我々は、一定の等価な「推定とキャンセル」制御法に着想を得た、非線形フィードバックポリシーのクラスを最適化する。
論文 参考訳(メタデータ) (2022-12-02T18:54:23Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Improper Learning with Gradient-based Policy Optimization [62.50997487685586]
未知のマルコフ決定過程に対して学習者がmベースコントローラを与えられる不適切な強化学習設定を考える。
制御器の不適切な混合のクラス上で動作する勾配に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T14:53:55Z) - The Impact of Data on the Stability of Learning-Based Control- Extended
Version [63.97366815968177]
本稿では,Lyapunovをベースとした,認証制御性能に対するデータの影響の定量化手法を提案する。
ガウス過程を通じて未知系の力学をモデル化することにより、モデルの不確実性と安定性条件の満足度の間の相互関係を決定できる。
論文 参考訳(メタデータ) (2020-11-20T19:10:01Z) - Learning Constrained Adaptive Differentiable Predictive Control Policies
With Guarantees [1.1086440815804224]
本稿では,線形システムに対する制約付きニューラルコントロールポリシーの学習方法として,微分可能予測制御(DPC)を提案する。
我々は,モデル予測制御(MPC)損失関数の逆伝搬と,微分可能な閉ループ系力学モデルによるペナルティの制約により,直接的な政策勾配を求めるために,自動微分を用いる。
論文 参考訳(メタデータ) (2020-04-23T14:24:44Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。