論文の概要: Bayesian Learning Approach to Model Predictive Control
- arxiv url: http://arxiv.org/abs/2203.02720v1
- Date: Sat, 5 Mar 2022 12:15:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 18:27:11.421747
- Title: Bayesian Learning Approach to Model Predictive Control
- Title(参考訳): モデル予測制御に対するベイズ学習アプローチ
- Authors: Namhoon Cho, Seokwon Lee, Hyo-Sang Shin, Antonios Tsourdos
- Abstract要約: ベイズ学習とサンプリングに基づくモデル予測制御に関する先行研究において、ハイレベルフレームワークが別々に開発された。
本研究は,オンライン学習者としての理解モデル予測制御の視点からインスピレーションを得て,ベイズ学習規則の視点をモデル予測制御設定に組み合わせたものである。
- 参考スコア(独自算出の注目度): 8.965772108396402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study presents a Bayesian learning perspective towards model predictive
control algorithms. High-level frameworks have been developed separately in the
earlier studies on Bayesian learning and sampling-based model predictive
control. On one hand, the Bayesian learning rule provides a general framework
capable of generating various machine learning algorithms as special instances.
On the other hand, the dynamic mirror descent model predictive control
framework is capable of diversifying sample-rollout-based control algorithms.
However, connections between the two frameworks have still not been fully
appreciated in the context of stochastic optimal control. This study combines
the Bayesian learning rule point of view into the model predictive control
setting by taking inspirations from the view of understanding model predictive
controller as an online learner. The selection of posterior class and natural
gradient approximation for the variational formulation governs diversification
of model predictive control algorithms in the Bayesian learning approach to
model predictive control. This alternative viewpoint complements the dynamic
mirror descent framework through streamlining the explanation of design
choices.
- Abstract(参考訳): 本研究では,モデル予測制御アルゴリズムに対するベイズ学習の視点を示す。
ベイズ学習とサンプリングに基づくモデル予測制御に関する以前の研究で、ハイレベルフレームワークが別々に開発された。
一方、ベイズ学習規則は、特別なインスタンスとして様々な機械学習アルゴリズムを生成できる汎用フレームワークを提供する。
一方、動的ミラー降下モデル予測制御フレームワークは、サンプルロールアウトに基づく制御アルゴリズムを多様化することができる。
しかしながら、2つのフレームワーク間の接続は、確率的最適制御の文脈ではまだ完全には評価されていない。
本研究では,モデル予測制御をオンライン学習者として理解することからインスピレーションを得て,ベイズ学習ルールの視点をモデル予測制御設定に組み合わせる。
変分定式化のための後方クラスおよび自然勾配近似の選択は、モデル予測制御に対するベイズ学習アプローチにおけるモデル予測制御アルゴリズムの多様化を規定する。
この代替的な視点は、設計選択の説明を合理化し、動的ミラー降下フレームワークを補完する。
関連論文リスト
- Supervised Score-Based Modeling by Gradient Boosting [49.556736252628745]
本稿では,スコアマッチングを組み合わせた勾配向上アルゴリズムとして,SSM(Supervised Score-based Model)を提案する。
推測時間と予測精度のバランスをとるため,SSMの学習とサンプリングに関する理論的解析を行った。
我々のモデルは、精度と推測時間の両方で既存のモデルより優れています。
論文 参考訳(メタデータ) (2024-11-02T07:06:53Z) - Model Predictive Control with Gaussian-Process-Supported Dynamical
Constraints for Autonomous Vehicles [82.65261980827594]
本研究では、学習したガウス過程を利用して人間の運転行動を予測する自動運転車のモデル予測制御手法を提案する。
マルチモード予測制御アプローチは、人間のドライバーの意図を考察する。
論文 参考訳(メタデータ) (2023-03-08T17:14:57Z) - Online Dynamics Learning for Predictive Control with an Application to
Aerial Robots [3.673994921516517]
予測モデルは学習し、モデルベースのコントローラに適用することができるが、これらのモデルはしばしばオフラインで学習される。
このオフライン設定では、トレーニングデータをまず収集し、精巧なトレーニング手順により予測モデルを学ぶ。
本稿では,デプロイ中の動的モデルの精度を継続的に向上するオンライン動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-19T15:51:25Z) - Neural Lyapunov Differentiable Predictive Control [2.042924346801313]
本稿では、確率的リアプノフに基づく安定性保証を備えた微分可能なプログラミングフレームワークを用いた学習に基づく予測制御手法を提案する。
この手法は、安定な力学で状態空間の領域を認証するリアプノフ関数を共同で学習する。
論文 参考訳(メタデータ) (2022-05-22T03:52:27Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Adaptive Model Predictive Control by Learning Classifiers [26.052368583196426]
制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
論文 参考訳(メタデータ) (2022-03-13T23:22:12Z) - Concept Drift Monitoring and Diagnostics of Supervised Learning Models
via Score Vectors [2.7716102039510564]
我々は,概念ドリフトの検出,監視,診断のための包括的かつ計算効率の高いフレームワークを開発した。
具体的には,適合モデルの対数類似度勾配として定義されるフィッシャースコアベクトルをモニターする。
一般的なエラーベース手法よりもパフォーマンス上のメリットは大きいが,従来は概念ドリフトモニタリングではスコアベースのアプローチが考慮されていなかった。
論文 参考訳(メタデータ) (2020-12-12T22:52:45Z) - Generative Temporal Difference Learning for Infinite-Horizon Prediction [101.59882753763888]
我々は、無限確率的地平線を持つ環境力学の予測モデルである$gamma$-modelを導入する。
トレーニングタイムとテストタイムの複合的なエラーの間には、そのトレーニングが避けられないトレードオフを反映しているかについて議論する。
論文 参考訳(メタデータ) (2020-10-27T17:54:12Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。