論文の概要: Adaptive Model Predictive Control by Learning Classifiers
- arxiv url: http://arxiv.org/abs/2203.06783v1
- Date: Sun, 13 Mar 2022 23:22:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 06:07:10.936935
- Title: Adaptive Model Predictive Control by Learning Classifiers
- Title(参考訳): 学習分類器による適応モデル予測制御
- Authors: Rel Guzman, Rafael Oliveira, Fabio Ramos
- Abstract要約: 制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
- 参考スコア(独自算出の注目度): 26.052368583196426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stochastic model predictive control has been a successful and robust control
framework for many robotics tasks where the system dynamics model is slightly
inaccurate or in the presence of environment disturbances. Despite the
successes, it is still unclear how to best adjust control parameters to the
current task in the presence of model parameter uncertainty and heteroscedastic
noise. In this paper, we propose an adaptive MPC variant that automatically
estimates control and model parameters by leveraging ideas from Bayesian
optimization (BO) and the classical expected improvement acquisition function.
We leverage recent results showing that BO can be formulated as a density ratio
estimation which can be efficiently approximated by simply learning a
classifier. This is then integrated into a model predictive path integral
control framework yielding robust controllers for a variety of challenging
robotics tasks. We demonstrate the approach on classical control problems under
model uncertainty and robotics manipulation tasks.
- Abstract(参考訳): 確率モデル予測制御は、システムダイナミクスモデルが少し不正確なり、環境障害が存在する多くのロボットタスクにおいて、成功し、堅牢な制御フレームワークである。
成功にもかかわらず、モデルパラメータの不確実性と異種雑音の存在下で、制御パラメータを現在のタスクに最適に調整する方法はまだ不明である。
本稿では,ベイズ最適化(bo)と古典的期待改善獲得関数のアイデアを活用し,制御パラメータとモデルパラメータを自動的に推定する適応型mpc変種を提案する。
分類器を学習するだけで効率的に近似できる密度比推定としてboを定式化できることを示す最近の研究結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
モデル不確実性とロボット操作タスクにおける古典的制御問題に対するアプローチを実証する。
関連論文リスト
- Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Predictable MDP Abstraction for Unsupervised Model-Based RL [93.91375268580806]
予測可能なMDP抽象化(PMA)を提案する。
元のMDPで予測モデルを訓練する代わりに、学習されたアクション空間を持つ変換MDPでモデルを訓練する。
我々はPMAを理論的に解析し、PMAが以前の教師なしモデルベースRLアプローチよりも大幅に改善することを示す。
論文 参考訳(メタデータ) (2023-02-08T07:37:51Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Bayesian Optimisation for Robust Model Predictive Control under Model
Parameter Uncertainty [26.052368583196426]
本稿では,モデル予測制御(MPC)ハイパーパラメータのチューニングのための適応最適化手法を提案する。
本研究では,異種難聴モデルを用いたベイズ最適化 (BO) アルゴリズムを開発し,様々なノイズに対処する。
実験結果から,本手法はより高い累積報酬とより安定したコントローラをもたらすことが示された。
論文 参考訳(メタデータ) (2022-03-01T15:33:21Z) - Sample-Efficient Reinforcement Learning via Conservative Model-Based
Actor-Critic [67.00475077281212]
モデルベース強化学習アルゴリズムは、モデルフリーのアルゴリズムよりもサンプル効率が高い。
本稿では,精度の高い学習モデルに強く依存することなく,高いサンプル効率を実現する新しい手法を提案する。
CMBACは,いくつかの課題に対して,サンプル効率の点で最先端のアプローチを著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-12-16T15:33:11Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Safe and Efficient Model-free Adaptive Control via Bayesian Optimization [39.962395119933596]
適応制御のための純粋データ駆動型モデルフリーアプローチを提案する。
システムデータのみに基づく低レベルコントローラのチューニングは、アルゴリズムの安全性と計算性能に懸念を生じさせる。
我々は,提案手法がサンプル効率であり,安全性の観点から制約ベイズ最適化よりも優れており,グリッド評価によって計算された性能オプティマを達成することを数値的に示す。
論文 参考訳(メタデータ) (2021-01-19T19:15:00Z) - Heteroscedastic Bayesian Optimisation for Stochastic Model Predictive
Control [23.180330602334223]
モデル予測制御(MPC)は、複雑な物理システムの制御を含むアプリケーションで成功している。
制御器の動作のランダム性に起因した余分な課題を提示する,MPC のコンテキストにおける微調整 MPC 手法について検討する。
論文 参考訳(メタデータ) (2020-10-01T05:31:41Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。