論文の概要: Performance-driven Constrained Optimal Auto-Tuner for MPC
- arxiv url: http://arxiv.org/abs/2503.07127v1
- Date: Mon, 10 Mar 2025 09:56:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:45:26.494566
- Title: Performance-driven Constrained Optimal Auto-Tuner for MPC
- Title(参考訳): MPCのための性能駆動型制約付き最適オートチューニング
- Authors: Albert Gassol Puigjaner, Manish Prajapat, Andrea Carron, Andreas Krause, Melanie N. Zeilinger,
- Abstract要約: MPCのための制約付き最適オートチューニングであるCOAT-MPCを提案する。
COAT-MPCは、パフォーマンスデータを収集し、その後続の信念を更新することによって学習する。
理論的にはCOAT-MPCを解析し,性能制約を任意に高い確率で満たすことを示した。
- 参考スコア(独自算出の注目度): 36.143463447995536
- License:
- Abstract: A key challenge in tuning Model Predictive Control (MPC) cost function parameters is to ensure that the system performance stays consistently above a certain threshold. To address this challenge, we propose a novel method, COAT-MPC, Constrained Optimal Auto-Tuner for MPC. With every tuning iteration, COAT-MPC gathers performance data and learns by updating its posterior belief. It explores the tuning parameters' domain towards optimistic parameters in a goal-directed fashion, which is key to its sample efficiency. We theoretically analyze COAT-MPC, showing that it satisfies performance constraints with arbitrarily high probability at all times and provably converges to the optimum performance within finite time. Through comprehensive simulations and comparative analyses with a hardware platform, we demonstrate the effectiveness of COAT-MPC in comparison to classical Bayesian Optimization (BO) and other state-of-the-art methods. When applied to autonomous racing, our approach outperforms baselines in terms of constraint violations and cumulative regret over time.
- Abstract(参考訳): モデル予測制御(MPC)のコスト関数パラメータをチューニングする上で重要な課題は、システム性能が一定の閾値を超えることを保証することである。
そこで本研究では,MPC用のCOAT-MPC(Constrained Optimal Auto-Tuner for MPC)を提案する。
チューニングイテレーション毎に、COAT-MPCはパフォーマンスデータを収集し、その後続の信念を更新することによって学習する。
目標指向の方法で楽観的なパラメータに対するチューニングパラメータのドメインを探索し、それがサンプル効率の鍵となる。
我々はCOAT-MPCを理論的に解析し、常に任意に高い確率で性能制約を満たすことを示し、有限時間以内の最適性能に確実に収束することを示す。
ハードウェアプラットフォームを用いた総合シミュレーションと比較分析により,従来のベイズ最適化(BO)や他の最先端手法と比較してCOAT-MPCの有効性を実証する。
自律レースに適用した場合、我々のアプローチは制約違反や累積的後悔という観点でベースラインを上回っます。
関連論文リスト
- Stability-informed Bayesian Optimization for MPC Cost Function Learning [5.643541009427271]
本研究では,不完全な情報の下での予測制御パラメータの閉ループ学習について検討する。
フィードフォワードニューラルネットワークとしてパラメータ化されたモデル予測制御器(MPC)コスト関数の学習には,制約付きベイズ最適化を用いる。
Lyapunov 候補として基礎となる MPC の最適値関数を利用して,学習した制御パラメータの安定性制約によってこの枠組みを拡張した。
論文 参考訳(メタデータ) (2024-04-18T13:49:09Z) - Controllable Prompt Tuning For Balancing Group Distributional Robustness [53.336515056479705]
グループ間で優れたパフォーマンスを実現するための最適化スキームを導入し、それらの性能を著しく犠牲にすることなく、全員に良い解決策を見出す。
本稿では,制御可能なプロンプトチューニング(CPT)を提案する。
突発的相関ベンチマークでは, 変換器と非変換器の両アーキテクチャ, および非モーダルおよびマルチモーダルデータにまたがって, 最先端の結果が得られた。
論文 参考訳(メタデータ) (2024-03-05T06:23:55Z) - CoVO-MPC: Theoretical Analysis of Sampling-based MPC and Optimal
Covariance Design [8.943418808959494]
我々は,広く使用されているサンプリングベースモデル予測経路積分制御(MPPI)法の収束特性を特徴付ける。
時間変動LQRシステムをカバーする2次最適化では,MPPIは少なくとも線形収束率を満足することを示す。
我々の理論解析は、サンプリングに基づく新しいMPCアルゴリズム、CoVo-MPCに直結する。
実証的には、CoVo-MPCはシミュレーションと現実世界のクワッドアジャイルコントロールの両方で標準MPPIを43~54%上回っている。
論文 参考訳(メタデータ) (2024-01-14T21:10:59Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Learning Sampling Distributions for Model Predictive Control [36.82905770866734]
モデル予測制御(MPC)に対するサンプリングに基づくアプローチは、MPCに対する現代のアプローチの基盤となっている。
我々は、学習された分布を最大限に活用できるように、潜在空間における全ての操作を実行することを提案する。
具体的には、学習問題を双方向の最適化として捉え、バックプロパゲーションスルータイムでコントローラをトレーニングする方法を示す。
論文 参考訳(メタデータ) (2022-12-05T20:35:36Z) - Bayesian Optimisation for Robust Model Predictive Control under Model
Parameter Uncertainty [26.052368583196426]
本稿では,モデル予測制御(MPC)ハイパーパラメータのチューニングのための適応最適化手法を提案する。
本研究では,異種難聴モデルを用いたベイズ最適化 (BO) アルゴリズムを開発し,様々なノイズに対処する。
実験結果から,本手法はより高い累積報酬とより安定したコントローラをもたらすことが示された。
論文 参考訳(メタデータ) (2022-03-01T15:33:21Z) - On Effective Scheduling of Model-based Reinforcement Learning [53.027698625496015]
実データ比率を自動的にスケジュールするAutoMBPOというフレームワークを提案する。
本稿ではまず,政策訓練における実データの役割を理論的に分析し,実際のデータの比率を徐々に高めれば,より優れた性能が得られることを示唆する。
論文 参考訳(メタデータ) (2021-11-16T15:24:59Z) - Blending MPC & Value Function Approximation for Efficient Reinforcement
Learning [42.429730406277315]
モデル予測制御(MPC)は、複雑な実世界のシステムを制御する強力なツールである。
モデルフリー強化学習(RL)によるMPC改善のためのフレームワークを提案する。
我々は,本手法がmpcに匹敵する性能と真のダイナミクスを両立できることを示す。
論文 参考訳(メタデータ) (2020-12-10T11:32:01Z) - Self-Tuning Stochastic Optimization with Curvature-Aware Gradient
Filtering [53.523517926927894]
サンプルごとのHessian-vector積と勾配を用いて、自己チューニングの二次構造を構築する。
モデルに基づく手続きが雑音勾配設定に収束することを証明する。
これは自己チューニング二次体を構築するための興味深いステップである。
論文 参考訳(メタデータ) (2020-11-09T22:07:30Z) - Mixed Strategies for Robust Optimization of Unknown Objectives [93.8672371143881]
そこでは,不確実なパラメータの最悪の実現に対して,未知の目的関数を最適化することを目的として,ロバストな最適化問題を考察する。
我々は,未知の目的をノイズ点評価から逐次学習する,新しいサンプル効率アルゴリズムGP-MROを設計する。
GP-MROは、最悪のケースで期待される目標値を最大化する、堅牢でランダムな混合戦略の発見を目指している。
論文 参考訳(メタデータ) (2020-02-28T09:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。