論文の概要: Control Barrier Functions for Unknown Nonlinear Systems using Gaussian
Processes
- arxiv url: http://arxiv.org/abs/2010.05818v1
- Date: Mon, 12 Oct 2020 16:12:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 08:19:16.738330
- Title: Control Barrier Functions for Unknown Nonlinear Systems using Gaussian
Processes
- Title(参考訳): ガウス過程を用いた未知非線形系の制御障壁関数
- Authors: Pushpak Jagtap, George J. Pappas, Majid Zamani
- Abstract要約: 本稿では,安全制約を確保しつつ,未知の非線形システムに対する制御器の合成に焦点をあてる。
学習段階において、未知の制御アフィン非線形力学を学習するために、学習したモデルの精度に統計的に拘束されるように、データ駆動方式を用いる。
第2の制御器合成ステップでは,学習モデルの不確実性を考慮した制御障壁関数の計算方式を開発する。
- 参考スコア(独自算出の注目度): 17.870440210358847
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper focuses on the controller synthesis for unknown, nonlinear systems
while ensuring safety constraints. Our approach consists of two steps, a
learning step that uses Gaussian processes and a controller synthesis step that
is based on control barrier functions. In the learning step, we use a
data-driven approach utilizing Gaussian processes to learn the unknown control
affine nonlinear dynamics together with a statistical bound on the accuracy of
the learned model. In the second controller synthesis steps, we develop a
systematic approach to compute control barrier functions that explicitly take
into consideration the uncertainty of the learned model. The control barrier
function not only results in a safe controller by construction but also
provides a rigorous lower bound on the probability of satisfaction of the
safety specification. Finally, we illustrate the effectiveness of the proposed
results by synthesizing a safety controller for a jet engine example.
- Abstract(参考訳): 本稿では,安全制約を確保しつつ未知の非線形系の制御器合成に着目する。
提案手法は,ガウス過程を用いた学習ステップと,制御障壁関数に基づく制御合成ステップの2段階からなる。
学習段階において、ガウス過程を利用したデータ駆動手法を用いて、未知の制御アフィン非線形ダイナミクスと学習モデルの精度の統計的境界を学習する。
第2のコントローラ合成ステップでは,学習モデルの不確かさを明示的に考慮した制御障壁関数を体系的に計算する手法を開発した。
制御バリア関数は、構成によって安全な制御装置が生成されるだけでなく、安全仕様の満足度に関する厳密な下限も提供する。
最後に,ジェットエンジンの例に対する安全制御器の合成による提案手法の有効性について述べる。
関連論文リスト
- Learning to Boost the Performance of Stable Nonlinear Systems [0.0]
クローズドループ安定性保証による性能ブースティング問題に対処する。
本手法は,安定な非線形システムのための性能ブースティング制御器のニューラルネットワーククラスを任意に学習することを可能にする。
論文 参考訳(メタデータ) (2024-05-01T21:11:29Z) - Real-Time Adaptive Safety-Critical Control with Gaussian Processes in
High-Order Uncertain Models [14.790031018404942]
本稿では,不確実なパラメータを持つシステムを対象とした適応型オンライン学習フレームワークを提案する。
まず,差分スパースGPアルゴリズムを改良するために,まず忘れ係数を積分する。
第2フェーズでは,高次制御バリア関数に基づく安全フィルタを提案する。
論文 参考訳(メタデータ) (2024-02-29T08:25:32Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Sample-efficient Safe Learning for Online Nonlinear Control with Control
Barrier Functions [35.9713619595494]
強化学習と連続非線形制御は、複雑なシーケンシャルな意思決定タスクの複数の領域にうまく展開されている。
学習過程の探索特性とモデル不確実性の存在を考えると、それらを安全クリティカルな制御タスクに適用することは困難である。
本稿では,オンライン制御タスクを対象とした,効率のよいエピソード型安全な学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-29T00:54:35Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - Verification of safety critical control policies using kernel methods [0.0]
ガウス過程を用いてハミルトン・ヤコビの到達可能性に固有の値関数の誤差をモデル化する枠組みを提案する。
誘導された安全制御装置は、任意のコントローラとの接続に使用することができ、安全なハイブリッド制御法を提供する。
論文 参考訳(メタデータ) (2022-03-23T13:33:02Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Learning Hybrid Control Barrier Functions from Data [66.37785052099423]
ハイブリッドシステムの安全な制御法則を得るための体系的なツールが欠如していることから,データから確実に安全な制御法則を学習するための最適化ベースのフレームワークを提案する。
特に、システムダイナミクスが知られており、安全なシステム動作を示すデータが利用可能であるような設定を仮定する。
論文 参考訳(メタデータ) (2020-11-08T23:55:02Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Learning Constrained Adaptive Differentiable Predictive Control Policies
With Guarantees [1.1086440815804224]
本稿では,線形システムに対する制約付きニューラルコントロールポリシーの学習方法として,微分可能予測制御(DPC)を提案する。
我々は,モデル予測制御(MPC)損失関数の逆伝搬と,微分可能な閉ループ系力学モデルによるペナルティの制約により,直接的な政策勾配を求めるために,自動微分を用いる。
論文 参考訳(メタデータ) (2020-04-23T14:24:44Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。