論文の概要: Local Bayesian Optimization for Controller Tuning with Crash Constraints
- arxiv url: http://arxiv.org/abs/2411.16267v1
- Date: Mon, 25 Nov 2024 10:37:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:18:12.476663
- Title: Local Bayesian Optimization for Controller Tuning with Crash Constraints
- Title(参考訳): クラッシュ制約を考慮した制御器チューニングのための局所ベイズ最適化
- Authors: Alexander von Rohr, David Stenger, Dominik Scheurenberg, Sebastian Trimpe,
- Abstract要約: 我々は最近提案されたBOの局所変種をクラッシュ制約を含むように拡張し、制御器は未知の既知領域でしか評価できないようにした。
本研究は,制御性能の向上とチューニングに必要な時間と資源の削減を目的としたローカルBOの可能性を示すものである。
- 参考スコア(独自算出の注目度): 47.30677525394649
- License:
- Abstract: Controller tuning is crucial for closed-loop performance but often involves manual adjustments. Although Bayesian optimization (BO) has been established as a data-efficient method for automated tuning, applying it to large and high-dimensional search spaces remains challenging. We extend a recently proposed local variant of BO to include crash constraints, where the controller can only be successfully evaluated in an a-priori unknown feasible region. We demonstrate the efficiency of the proposed method through simulations and hardware experiments. Our findings showcase the potential of local BO to enhance controller performance and reduce the time and resources necessary for tuning.
- Abstract(参考訳): コントローラチューニングはクローズドループのパフォーマンスには不可欠だが、手動で調整することが多い。
ベイズ最適化(BO)は自動チューニングのためのデータ効率のよい手法として確立されているが、大規模かつ高次元の探索空間に適用することは依然として困難である。
我々は最近提案されたBOの局所変種をクラッシュ制約を含むように拡張し、制御器は未知の既知領域でしか評価できないようにした。
シミュレーションとハードウェア実験により提案手法の有効性を実証する。
本研究は,制御性能の向上とチューニングに必要な時間と資源の削減を目的としたローカルBOの可能性を示すものである。
関連論文リスト
- Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Violation-Aware Contextual Bayesian Optimization for Controller
Performance Optimization with Unmodeled Constraints [1.8730951928453339]
非モデル化力学を用いた閉ループ制御システムの性能最適化問題について検討する。
本稿では,制約対応ソリューションを学習しながらクローズドループ性能を最適化する,違反認識型コンテキストBOアルゴリズム(VACBO)を提案する。
本研究では, 産業用蒸気圧縮システムの時変温度および湿度下でのエネルギー最小化のためのVACBO法の有効性を実証する。
論文 参考訳(メタデータ) (2023-01-28T05:48:40Z) - Performance-Driven Controller Tuning via Derivative-Free Reinforcement
Learning [6.5158195776494]
我々は,新しい微分自由強化学習フレームワークを用いて,制御器のチューニング問題に取り組む。
我々は,PIDコントローラを用いた適応走行制御とMPCコントローラを用いた軌道追跡という,自律走行による2つの具体例に関する数値実験を行った。
実験の結果,提案手法は一般的なベースラインよりも優れており,コントローラチューニングの強い可能性を強調している。
論文 参考訳(メタデータ) (2022-09-11T13:01:14Z) - On Controller Tuning with Time-Varying Bayesian Optimization [74.57758188038375]
制御対象とその変更に関する適切な事前知識を用いて、時間変化最適化(TVBO)を用いて、変更環境におけるコントローラのオンラインチューニングを行う。
本研究では,不確実性注入(UI)を用いたTVBO戦略を提案する。
我々のモデルはTVBOの最先端手法よりも優れており、後悔の軽減と不安定なパラメータ構成の低減を実現している。
論文 参考訳(メタデータ) (2022-07-22T14:54:13Z) - Tuning Particle Accelerators with Safety Constraints using Bayesian
Optimization [73.94660141019764]
粒子加速器の機械パラメータのチューニングは反復的で時間を要する作業である。
我々は、安全なベイズ最適化のステップサイズ制限版を提案し、評価する。
論文 参考訳(メタデータ) (2022-03-26T02:21:03Z) - VABO: Violation-Aware Bayesian Optimization for Closed-Loop Control
Performance Optimization with Unmodeled Constraints [2.205124036454768]
非モデル化力学を用いた閉ループ制御システムの性能最適化問題について検討する。
本稿では,制約対応ソリューションを同時に学習しながら,閉ループ性能を最適化する違反対応BOアルゴリズム(VABO)を提案する。
産業用蒸気圧縮システムのエネルギー最小化のためのVABO法の有効性を実証する。
論文 参考訳(メタデータ) (2021-10-14T15:51:03Z) - Regret-optimal Estimation and Control [52.28457815067461]
後悔最適推定器と後悔最適制御器は状態空間形式で導出可能であることを示す。
非線形力学系に対するモデル予測制御(MPC)と拡張KalmanFilter(EKF)の残差最適類似性を提案する。
論文 参考訳(メタデータ) (2021-06-22T23:14:21Z) - Safe and Efficient Model-free Adaptive Control via Bayesian Optimization [39.962395119933596]
適応制御のための純粋データ駆動型モデルフリーアプローチを提案する。
システムデータのみに基づく低レベルコントローラのチューニングは、アルゴリズムの安全性と計算性能に懸念を生じさせる。
我々は,提案手法がサンプル効率であり,安全性の観点から制約ベイズ最適化よりも優れており,グリッド評価によって計算された性能オプティマを達成することを数値的に示す。
論文 参考訳(メタデータ) (2021-01-19T19:15:00Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。