論文の概要: Adaptive Robust Model Predictive Control via Uncertainty Cancellation
- arxiv url: http://arxiv.org/abs/2212.01371v1
- Date: Fri, 2 Dec 2022 18:54:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 18:03:54.692567
- Title: Adaptive Robust Model Predictive Control via Uncertainty Cancellation
- Title(参考訳): 不確かさキャンセラによる適応ロバストモデル予測制御
- Authors: Rohan Sinha, James Harrison, Spencer M. Richards, and Marco Pavone
- Abstract要約: 本稿では,動的に重要な不確かさを補う学習に基づく頑健な予測制御アルゴリズムを提案する。
我々は、一定の等価な「推定とキャンセル」制御法に着想を得た、非線形フィードバックポリシーのクラスを最適化する。
- 参考スコア(独自算出の注目度): 25.736296938185074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a learning-based robust predictive control algorithm that
compensates for significant uncertainty in the dynamics for a class of
discrete-time systems that are nominally linear with an additive nonlinear
component. Such systems commonly model the nonlinear effects of an unknown
environment on a nominal system. We optimize over a class of nonlinear feedback
policies inspired by certainty equivalent "estimate-and-cancel" control laws
pioneered in classical adaptive control to achieve significant performance
improvements in the presence of uncertainties of large magnitude, a setting in
which existing learning-based predictive control algorithms often struggle to
guarantee safety. In contrast to previous work in robust adaptive MPC, our
approach allows us to take advantage of structure (i.e., the numerical
predictions) in the a priori unknown dynamics learned online through function
approximation. Our approach also extends typical nonlinear adaptive control
methods to systems with state and input constraints even when we cannot
directly cancel the additive uncertain function from the dynamics. We apply
contemporary statistical estimation techniques to certify the system's safety
through persistent constraint satisfaction with high probability. Moreover, we
propose using Bayesian meta-learning algorithms that learn calibrated model
priors to help satisfy the assumptions of the control design in challenging
settings. Finally, we show in simulation that our method can accommodate more
significant unknown dynamics terms than existing methods and that the use of
Bayesian meta-learning allows us to adapt to the test environments more
rapidly.
- Abstract(参考訳): そこで本研究では,非線形成分を付加的に線形とする離散時間系の力学の不確かさを補う学習ベースのロバスト予測制御アルゴリズムを提案する。
このようなシステムは通常、未知の環境の非線形効果を名目システム上でモデル化する。
従来の学習に基づく予測制御アルゴリズムが安全性を保証するのに苦戦する状況である大規模不確実性の存在下で、古典的適応制御の先駆的な「推定・回避」制御法に触発された非線形フィードバックポリシーのクラスを最適化する。
頑健な適応型MPCにおける従来の研究とは対照的に、我々の手法は関数近似を通じてオンラインに学習された事前未知の力学における構造(すなわち数値予測)を活用できる。
提案手法は, 動的関数から加法的不確定関数を直接キャンセルできない場合でも, 状態制約と入力制約を持つシステムに典型的な非線形適応制御手法を拡張する。
確率の高い持続的制約満足度を通してシステムの安全性を証明するために,同時代の統計的推定手法を適用した。
さらに,制御設計の仮定を満たすために,校正モデルの事前学習を行うベイズメタ学習アルゴリズムを提案する。
最後に,本手法が既存の手法よりも重要な未知ダイナミクス条件に対応できることを示すとともに,ベイズメタラーニングを用いることにより,より迅速にテスト環境に適応できることを示す。
関連論文リスト
- Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Online Nonstochastic Model-Free Reinforcement Learning [35.377261344335736]
本研究では,動的あるいは敵対的な環境に対するロバストモデルロバスト性保証について検討する。
これらのポリシーを最適化するための効率的かつ効率的なアルゴリズムを提供する。
これらは状態空間に依存せず、状態空間に依存しない最もよく知られた発展である。
論文 参考訳(メタデータ) (2023-05-27T19:02:55Z) - Learning-enhanced Nonlinear Model Predictive Control using
Knowledge-based Neural Ordinary Differential Equations and Deep Ensembles [5.650647159993238]
本研究では,知識に基づくニューラル常微分方程式(KNODE)とディープアンサンブルというディープラーニングツールを活用し,モデル予測制御(MPC)の予測精度を向上させる。
特に、KNODEモデルのアンサンブル(KNODEアンサンブル)を学習し、真のシステム力学の正確な予測を得る。
KNODEアンサンブルはより正確な予測を提供し、提案した非線形MPCフレームワークの有効性と閉ループ性能を示す。
論文 参考訳(メタデータ) (2022-11-24T23:51:18Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Adaptive Robust Model Predictive Control with Matched and Unmatched
Uncertainty [28.10549712956161]
離散時間系のダイナミクスにおける大きな不確実性を扱うことができる学習ベースの堅牢な予測制御アルゴリズムを提案する。
既存の学習に基づく予測制御アルゴリズムが大規模な不確実性が存在する場合の安全性を確保することができず、性能が大幅に向上する。
論文 参考訳(メタデータ) (2021-04-16T17:47:02Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Improper Learning with Gradient-based Policy Optimization [62.50997487685586]
未知のマルコフ決定過程に対して学習者がmベースコントローラを与えられる不適切な強化学習設定を考える。
制御器の不適切な混合のクラス上で動作する勾配に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-02-16T14:53:55Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Learning Constrained Adaptive Differentiable Predictive Control Policies
With Guarantees [1.1086440815804224]
本稿では,線形システムに対する制約付きニューラルコントロールポリシーの学習方法として,微分可能予測制御(DPC)を提案する。
我々は,モデル予測制御(MPC)損失関数の逆伝搬と,微分可能な閉ループ系力学モデルによるペナルティの制約により,直接的な政策勾配を求めるために,自動微分を用いる。
論文 参考訳(メタデータ) (2020-04-23T14:24:44Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。