論文の概要: A Hierarchical Surrogate Model for Efficient Multi-Task Parameter Learning in Closed-Loop Control
- arxiv url: http://arxiv.org/abs/2508.12738v2
- Date: Tue, 19 Aug 2025 06:46:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 11:25:17.717564
- Title: A Hierarchical Surrogate Model for Efficient Multi-Task Parameter Learning in Closed-Loop Control
- Title(参考訳): 閉ループ制御における効率的なマルチタスクパラメータ学習のための階層的サロゲートモデル
- Authors: Sebastian Hirt, Lukas Theiner, Maik Pfefferkorn, Rolf Findeisen,
- Abstract要約: 本稿では,効率的な制御パラメータ学習に適した階層型ベイズ最適化(BO)フレームワークを提案する。
閉ループコストをブラックボックスとして扱う代わりに,本手法は根本問題の構造的知識を活用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many control problems require repeated tuning and adaptation of controllers across distinct closed-loop tasks, where data efficiency and adaptability are critical. We propose a hierarchical Bayesian optimization (BO) framework that is tailored to efficient controller parameter learning in sequential decision-making and control scenarios for distinct tasks. Instead of treating the closed-loop cost as a black-box, our method exploits structural knowledge of the underlying problem, consisting of a dynamical system, a control law, and an associated closed-loop cost function. We construct a hierarchical surrogate model using Gaussian processes that capture the closed-loop state evolution under different parameterizations, while the task-specific weighting and accumulation into the closed-loop cost are computed exactly via known closed-form expressions. This allows knowledge transfer and enhanced data efficiency between different closed-loop tasks. The proposed framework retains sublinear regret guarantees on par with standard black-box BO, while enabling multi-task or transfer learning. Simulation experiments with model predictive control demonstrate substantial benefits in both sample efficiency and adaptability when compared to purely black-box BO approaches.
- Abstract(参考訳): 多くの制御問題は、データ効率と適応性が重要なクローズドループタスクにまたがって、コントローラの繰り返しチューニングと適応を必要とする。
本稿では,タスクの逐次決定および制御シナリオにおける効率的な制御パラメータ学習に適した階層型ベイズ最適化(BO)フレームワークを提案する。
本手法では, 閉ループコストをブラックボックスとして扱う代わりに, 動的システム, 制御則, 関連する閉ループコスト関数からなる基礎問題の構造的知識を利用する。
ガウス過程を用いた階層的サロゲートモデルを構築し,各パラメータ化の下で閉ループ状態の進化を捉える一方,クローズドループコストへのタスク固有の重み付けと累積は,既知のクローズドフォーム表現によって正確に計算される。
これにより、異なるクローズドループタスク間の知識伝達とデータ効率の向上が可能になる。
提案フレームワークは,マルチタスクやトランスファー学習を実現しつつ,標準的なブラックボックスBOと同等のサブ線形後悔保証を維持している。
モデル予測制御を用いたシミュレーション実験は, 純ブラックボックスBO法と比較して, 試料効率と適応性の両方に有意な効果を示す。
関連論文リスト
- Cost-Sensitive Multi-Fidelity Bayesian Optimization with Transfer of Learning Curve Extrapolation [55.75188191403343]
各ユーザが事前に定義した機能であるユーティリティを導入し,BOのコストと性能のトレードオフについて述べる。
このアルゴリズムをLCデータセット上で検証した結果,従来のマルチファイルBOや転送BOベースラインよりも優れていた。
論文 参考訳(メタデータ) (2024-05-28T07:38:39Z) - M-HOF-Opt: Multi-Objective Hierarchical Output Feedback Optimization via Multiplier Induced Loss Landscape Scheduling [4.369346338392536]
連立モデルパラメータと乗算器の進化をモデル化した確率的グラフィカルモデルを提案する。
代用単目的ペナルティ損失による多目的モデルパラメータ最適化に対処する。
論文 参考訳(メタデータ) (2024-03-20T16:38:26Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - Optimal Control of Nonlinear Systems with Unknown Dynamics [4.551160285910024]
本稿では,閉ループ最適制御器の探索のためのデータ駆動方式を提案する。
任意の初期状態が与えられた未知の力学を持つ系に対する特定の無限水平コスト関数を最小化する。
論文 参考訳(メタデータ) (2023-05-24T14:27:22Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Finite-time System Identification and Adaptive Control in Autoregressive
Exogenous Systems [79.67879934935661]
未知のARXシステムのシステム識別と適応制御の問題について検討する。
我々は,オープンループとクローズループの両方のデータ収集の下で,ARXシステムに対する有限時間学習保証を提供する。
論文 参考訳(メタデータ) (2021-08-26T18:00:00Z) - Data-Driven Optimized Tracking Control Heuristic for MIMO Structures: A
Balance System Case Study [8.035375408614776]
PIDは2入力の2アウトプットバランスシステムで示される。
自己調整型非線形しきい値とニューラルネットワークを統合し、所望の過渡特性と定常特性を妥協する。
ニューラルネットワークは、客観的コスト関数のような重み付き導関数の最適化を訓練する。
論文 参考訳(メタデータ) (2021-04-01T02:00:20Z) - Towards Interpretable-AI Policies Induction using Evolutionary Nonlinear
Decision Trees for Discrete Action Systems [8.322816790979285]
我々は最近提案された非線形決定木(NLDT)アプローチを用いて,階層的な制御規則の集合を求める。
1ルールあたり1から4の非線形項を含む比較的単純かつ解釈可能な規則が得られ、同時にパラ閉ループ性能が達成される。
論文 参考訳(メタデータ) (2020-09-20T20:41:57Z) - Trajectory Optimization for Nonlinear Multi-Agent Systems using
Decentralized Learning Model Predictive Control [5.2647625557619815]
非線形疎結合力学と結合状態制約を持つマルチエージェントシステムに対する学習モデル予測制御に基づく分散化最小時間軌道最適化手法を提案する。
このフレームワークは,タスク実行の各イテレーションにおけるエージェント間の通信を不要とし,永続的実現性,有限時間閉ループ収束性,グローバルシステムのタスク反復による非遅延性能を保証する。
論文 参考訳(メタデータ) (2020-04-02T23:04:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。