論文の概要: Real-Time Online Learning for Model Predictive Control using a Spatio-Temporal Gaussian Process Approximation
- arxiv url: http://arxiv.org/abs/2603.17632v1
- Date: Wed, 18 Mar 2026 11:53:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.947639
- Title: Real-Time Online Learning for Model Predictive Control using a Spatio-Temporal Gaussian Process Approximation
- Title(参考訳): 時空間ガウス過程近似を用いたモデル予測制御のためのリアルタイムオンライン学習
- Authors: Lars Bartels, Amon Lahr, Andrea Carron, Melanie N. Zeilinger,
- Abstract要約: この研究は、オンライン学習を一定の計算複雑性で提供する、時間的近似GPモデルの効率的な実装を示す。
GP-MPCに最適化されており、オンラインでより正確なシステムダイナミクスをリアルタイムで学習することで制御性能を向上させることができる。
提案手法の性能は,シミュレーションおよびハードウェア実験により,自律型ミニチュアレースの模範的応用として実証された。
- 参考スコア(独自算出の注目度): 3.1977149161426657
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based model predictive control (MPC) can enhance control performance by correcting for model inaccuracies, enabling more precise state trajectory predictions than traditional MPC. A common approach is to model unknown residual dynamics as a Gaussian process (GP), which leverages data and also provides an estimate of the associated uncertainty. However, the high computational cost of online learning poses a major challenge for real-time GP-MPC applications. This work presents an efficient implementation of an approximate spatio-temporal GP model, offering online learning at constant computational complexity. It is optimized for GP-MPC, where it enables improved control performance by learning more accurate system dynamics online in real-time, even for time-varying systems. The performance of the proposed method is demonstrated by simulations and hardware experiments in the exemplary application of autonomous miniature racing.
- Abstract(参考訳): 学習ベースモデル予測制御(MPC)は、モデル不正確性を補正することで制御性能を向上させることができ、従来のMPCよりも正確な状態軌跡予測を可能にする。
一般的なアプローチは未知の残留力学をガウス過程(GP)としてモデル化することであり、これはデータを活用し、関連する不確実性を推定するものである。
しかし、オンライン学習の計算コストが高いことは、リアルタイムGP-MPCアプリケーションにとって大きな課題となる。
本研究は, ほぼ時空間GPモデルの効率的な実装であり, オンライン学習を一定の計算複雑性で実現する。
GP-MPC向けに最適化されており、リアルタイムにより正確なシステムダイナミクスを学習することで制御性能を向上させることができる。
提案手法の性能は,シミュレーションおよびハードウェア実験により,自律型ミニチュアレースの模範的応用として実証された。
関連論文リスト
- Recursive Gaussian Process State Space Model [9.626897250334155]
動作領域とGPハイパーパラメータの両方に適応可能な新しいオンラインGPSSM法を提案する。
ポイントを誘導するオンライン選択アルゴリズムは、情報的基準に基づいて開発され、軽量な学習を実現する。
合成データセットと実世界のデータセットの総合的な評価は,提案手法の精度,計算効率,適応性を示す。
論文 参考訳(メタデータ) (2024-11-22T02:22:59Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - End-to-End Reinforcement Learning of Koopman Models for Economic Nonlinear Model Predictive Control [45.84205238554709]
本研究では, (e)NMPCの一部として最適性能を示すために, Koopman シュロゲートモデルの強化学習法を提案する。
エンドツーエンドトレーニングモデルは,(e)NMPCにおけるシステム識別を用いてトレーニングしたモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-03T10:21:53Z) - Can Learning Deteriorate Control? Analyzing Computational Delays in
Gaussian Process-Based Event-Triggered Online Learning [7.697964930378468]
計算遅延を考慮したGPベースのオンライン学習のための新しいイベントトリガを提案する。
十分に少ない計算時間で、オフラインで訓練されたGPモデルよりも有利であることを示す。
論文 参考訳(メタデータ) (2023-05-14T14:37:33Z) - Model Predictive Control via On-Policy Imitation Learning [28.96122879515294]
我々は,データ駆動型モデル予測制御のための新しいサンプル複雑性結果と性能保証を開発する。
我々のアルゴリズムは制約付き線形MPCの構造を用いており、解析は明示的なMPC解の特性を用いて、最適性能を達成するのに必要なオンラインMPCトラジェクトリの数を理論的に制限する。
論文 参考訳(メタデータ) (2022-10-17T16:06:06Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。