論文の概要: Safe and Efficient Model-free Adaptive Control via Bayesian Optimization
- arxiv url: http://arxiv.org/abs/2101.07825v2
- Date: Tue, 2 Mar 2021 13:26:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 11:23:51.058118
- Title: Safe and Efficient Model-free Adaptive Control via Bayesian Optimization
- Title(参考訳): ベイズ最適化による安全かつ効率的なモデルフリー適応制御
- Authors: Christopher K\"onig, Matteo Turchetta, John Lygeros, Alisa Rupenyan,
Andreas Krause
- Abstract要約: 適応制御のための純粋データ駆動型モデルフリーアプローチを提案する。
システムデータのみに基づく低レベルコントローラのチューニングは、アルゴリズムの安全性と計算性能に懸念を生じさせる。
我々は,提案手法がサンプル効率であり,安全性の観点から制約ベイズ最適化よりも優れており,グリッド評価によって計算された性能オプティマを達成することを数値的に示す。
- 参考スコア(独自算出の注目度): 39.962395119933596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive control approaches yield high-performance controllers when a precise
system model or suitable parametrizations of the controller are available.
Existing data-driven approaches for adaptive control mostly augment standard
model-based methods with additional information about uncertainties in the
dynamics or about disturbances. In this work, we propose a purely data-driven,
model-free approach for adaptive control. Tuning low-level controllers based
solely on system data raises concerns on the underlying algorithm safety and
computational performance. Thus, our approach builds on GoOSE, an algorithm for
safe and sample-efficient Bayesian optimization. We introduce several
computational and algorithmic modifications in GoOSE that enable its practical
use on a rotational motion system. We numerically demonstrate for several types
of disturbances that our approach is sample efficient, outperforms constrained
Bayesian optimization in terms of safety, and achieves the performance optima
computed by grid evaluation. We further demonstrate the proposed adaptive
control approach experimentally on a rotational motion system.
- Abstract(参考訳): 適応制御アプローチは、正確なシステムモデルやコントローラの適切なパラメトリゼーションが利用できる場合に、高性能なコントローラが得られる。
適応制御のための既存のデータ駆動アプローチは、ダイナミクスの不確実性や外乱に関する追加情報を伴う標準モデルベースメソッドをほとんど強化している。
本研究では,適応制御のための純粋データ駆動モデルフリーアプローチを提案する。
システムデータのみに基づく低レベルコントローラのチューニングは、アルゴリズムの安全性と計算性能に懸念を生じさせる。
提案手法は安全かつサンプル効率のよいベイズ最適化アルゴリズムであるGoOSEに基づいている。
本稿では,GoOSEの回転運動システムにおける実用性を実現するために,いくつかの計算およびアルゴリズムの修正を導入する。
我々は,提案手法がサンプル効率であり,安全性の観点から制約ベイズ最適化よりも優れており,グリッド評価によって計算された性能オプティマを達成することを数値的に示す。
さらに,提案する適応制御手法を回転運動系で実験的に実証する。
関連論文リスト
- Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Adaptive Model Predictive Control by Learning Classifiers [26.052368583196426]
制御パラメータとモデルパラメータを自動的に推定する適応型MPC変種を提案する。
我々は,BOを密度比推定として定式化できることを示す最近の結果を活用する。
その後、これはモデル予測経路積分制御フレームワークに統合され、様々な困難なロボティクスタスクのための堅牢なコントローラを生成する。
論文 参考訳(メタデータ) (2022-03-13T23:22:12Z) - Learning Robust Output Control Barrier Functions from Safe Expert
Demonstrations [50.37808220291108]
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
我々は,自律走行シミュレータCARLAのアルゴリズムを実証的に検証し,RGBカメラ画像から安全な制御法を学習する方法を実証する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Adaptive control of a mechatronic system using constrained residual
reinforcement learning [0.0]
本研究では,不確実な環境下での従来のコントローラの性能向上のための,シンプルで実用的で直感的な手法を提案する。
本手法は, 産業用モーションコントロールにおける従来の制御器が, 異なる動作条件に対応するために適応性よりも頑健であることを示す。
論文 参考訳(メタデータ) (2021-10-06T08:13:05Z) - Gaussian Process-based Min-norm Stabilizing Controller for
Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。
この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文 参考訳(メタデータ) (2020-11-14T01:27:32Z) - Adaptive Optimal Trajectory Tracking Control Applied to a Large-Scale
Ball-on-Plate System [0.0]
ADPを用いた大規模ボール・オン・プレートシステムのための最適軌道追従制御器を提案する。
提案手法では,セットポイントトラッキングの代わりに参照軌道を近似し,一定のオフセット項を自動的に補償することができる。
実験の結果, このトラッキング機構は, セットポイントコントローラに比べて制御コストを大幅に削減することがわかった。
論文 参考訳(メタデータ) (2020-10-26T11:22:03Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。