論文の概要: Bayesian Optimisation for Robust Model Predictive Control under Model
Parameter Uncertainty
- arxiv url: http://arxiv.org/abs/2203.00551v2
- Date: Wed, 2 Mar 2022 21:29:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 13:14:11.444152
- Title: Bayesian Optimisation for Robust Model Predictive Control under Model
Parameter Uncertainty
- Title(参考訳): モデルパラメータの不確かさを考慮したロバストモデル予測制御のためのベイズ最適化
- Authors: Rel Guzman, Rafael Oliveira, Fabio Ramos
- Abstract要約: 本稿では,モデル予測制御(MPC)ハイパーパラメータのチューニングのための適応最適化手法を提案する。
本研究では,異種難聴モデルを用いたベイズ最適化 (BO) アルゴリズムを開発し,様々なノイズに対処する。
実験結果から,本手法はより高い累積報酬とより安定したコントローラをもたらすことが示された。
- 参考スコア(独自算出の注目度): 26.052368583196426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose an adaptive optimisation approach for tuning stochastic model
predictive control (MPC) hyper-parameters while jointly estimating probability
distributions of the transition model parameters based on performance rewards.
In particular, we develop a Bayesian optimisation (BO) algorithm with a
heteroscedastic noise model to deal with varying noise across the MPC
hyper-parameter and dynamics model parameter spaces. Typical homoscedastic
noise models are unrealistic for tuning MPC since stochastic controllers are
inherently noisy, and the level of noise is affected by their hyper-parameter
settings. We evaluate the proposed optimisation algorithm in simulated control
and robotics tasks where we jointly infer control and dynamics parameters.
Experimental results demonstrate that our approach leads to higher cumulative
rewards and more stable controllers.
- Abstract(参考訳): 本稿では,確率モデル予測制御(mpc)ハイパーパラメータの適応最適化手法を提案し,性能評価に基づく遷移モデルパラメータの確率分布を共同で推定する。
特に,MPCハイパーパラメータおよびダイナミックスモデルパラメータ空間にまたがる様々なノイズに対処するために,非定常雑音モデルを用いたベイズ最適化(BO)アルゴリズムを開発した。
典型的なホモシダスティックノイズモデルは、確率制御器が本質的にノイズが多いため、MPCのチューニングには非現実的であり、ノイズのレベルは超パラメータ設定の影響を受けます。
シミュレーション制御とロボットのタスクにおいて,制御パラメータと動的パラメータを共同で推論する最適化アルゴリズムの評価を行った。
実験の結果,我々のアプローチは累積的な報酬とより安定したコントローラをもたらすことがわかった。
関連論文リスト
- Semantic Codebook Learning for Dynamic Recommendation Models [55.98259490159084]
動的シーケンシャルレコメンデーション(DSR)は、ユーザの振る舞いに基づいてモデルパラメータを生成し、シーケンシャルレコメンデーションのパーソナライズを改善する。
巨大なパラメータ探索空間と疎結合でノイズの多いユーザ-イテム相互作用の課題に直面するため、生成されたモデルパラメータの適用性が低下する。
Semantic Codebook Learning for Dynamic Recommendation Models (SOLID)フレームワークは、これらの課題に効果的に取り組むことで、DSRの大幅な進歩を示す。
論文 参考訳(メタデータ) (2024-07-31T19:25:25Z) - Scaling Exponents Across Parameterizations and Optimizers [94.54718325264218]
本稿では,先行研究における重要な仮定を考察し,パラメータ化の新たな視点を提案する。
私たちの経験的調査には、3つの組み合わせでトレーニングされた数万のモデルが含まれています。
最高の学習率のスケーリング基準は、以前の作業の仮定から除外されることがよくあります。
論文 参考訳(メタデータ) (2024-07-08T12:32:51Z) - Variational Inference of Parameters in Opinion Dynamics Models [9.51311391391997]
この研究は、変数推論を用いて、意見力学 ABM のパラメータを推定する。
我々は推論プロセスを自動微分に適した最適化問題に変換する。
提案手法は, シミュレーションベース法とMCMC法より, マクロ的(有界信頼区間とバックファイア閾値)と微視的(200ドル, エージェントレベルの役割)の両方を正確に推定する。
論文 参考訳(メタデータ) (2024-03-08T14:45:18Z) - Improve Noise Tolerance of Robust Loss via Noise-Awareness [60.34670515595074]
本稿では,NARL-Adjuster(NARL-Adjuster for brevity)と呼ばれる,ハイパーパラメータ予測関数を適応的に学習するメタラーニング手法を提案する。
4つのSOTAロバストな損失関数を我々のアルゴリズムに統合し,提案手法の一般性および性能をノイズ耐性と性能の両面で検証した。
論文 参考訳(メタデータ) (2023-01-18T04:54:58Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Optimization of Annealed Importance Sampling Hyperparameters [77.34726150561087]
Annealed Importance Smpling (AIS) は、深層生成モデルの難易度を推定するために使われる一般的なアルゴリズムである。
本稿では、フレキシブルな中間分布を持つパラメータAISプロセスを提案し、サンプリングに少ないステップを使用するようにブリッジング分布を最適化する。
我々は, 最適化AISの性能評価を行い, 深部生成モデルの限界推定を行い, 他の推定値と比較した。
論文 参考訳(メタデータ) (2022-09-27T07:58:25Z) - Adaptive Model Predictive Control by Learning Classifiers [26.052368583196426]
制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
論文 参考訳(メタデータ) (2022-03-13T23:22:12Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Heteroscedastic Bayesian Optimisation for Stochastic Model Predictive
Control [23.180330602334223]
モデル予測制御(MPC)は、複雑な物理システムの制御を含むアプリケーションで成功している。
制御器の動作のランダム性に起因した余分な課題を提示する,MPC のコンテキストにおける微調整 MPC 手法について検討する。
論文 参考訳(メタデータ) (2020-10-01T05:31:41Z) - Accurate Parameter Estimation for Risk-aware Autonomous Systems [0.0]
本稿では,自律システムの動的モデルのパラメータを推定するためのスペクトル線に基づくアプローチについて述べる。
既存の文献では、力学系のすべての非モデル化された成分をガウス下雑音として扱っている。
提案手法は既存の文献と一致して$tildeO(sqrtT)$ regretを保証できることを示す。
論文 参考訳(メタデータ) (2020-06-23T01:20:44Z) - Online Parameter Estimation for Safety-Critical Systems with Gaussian
Processes [6.122161391301866]
オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。
パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。
我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。
論文 参考訳(メタデータ) (2020-02-18T20:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。