論文の概要: Training Neural Network Controllers Using Control Barrier Functions in
the Presence of Disturbances
- arxiv url: http://arxiv.org/abs/2001.08088v1
- Date: Sat, 18 Jan 2020 18:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 05:12:17.018931
- Title: Training Neural Network Controllers Using Control Barrier Functions in
the Presence of Disturbances
- Title(参考訳): 外乱の存在下での制御障壁関数を用いたニューラルネットワーク制御の訓練
- Authors: Shakiba Yaghoubi, Georgios Fainekos, Sriram Sankaranarayanan
- Abstract要約: 本稿では,ニューラルネットワークに基づくフィードバックコントローラの学習に模倣学習を用いることを提案する。
また,外乱下におけるシステムのための新しい高次CBFも開発している。
- 参考スコア(独自算出の注目度): 9.21721532941863
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Control Barrier Functions (CBF) have been recently utilized in the design of
provably safe feedback control laws for nonlinear systems. These feedback
control methods typically compute the next control input by solving an online
Quadratic Program (QP). Solving QP in real-time can be a computationally
expensive process for resource constraint systems. In this work, we propose to
use imitation learning to learn Neural Network-based feedback controllers which
will satisfy the CBF constraints. In the process, we also develop a new class
of High Order CBF for systems under external disturbances. We demonstrate the
framework on a unicycle model subject to external disturbances, e.g., wind or
currents.
- Abstract(参考訳): 制御バリア関数 (CBF) は, 非線形システムに対する安全なフィードバック制御法の設計に最近利用されている。
これらのフィードバック制御方法は、通常、オンライン二次プログラム(QP)を解くことで次の制御入力を計算する。
リアルタイムにQPを解くことは、資源制約システムの計算にコストがかかるプロセスである。
本研究では,CBF制約を満たすニューラルネットワークに基づくフィードバックコントローラの学習に模倣学習を用いることを提案する。
また,外乱下におけるシステムに対して,新しい高次CBFのクラスを開発する。
風や電流などの外乱を受ける一輪車モデルの枠組みを実証する。
関連論文リスト
- Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Learning Robust and Correct Controllers from Signal Temporal Logic
Specifications Using BarrierNet [5.809331819510702]
我々は,STL定量的セマンティクスを利用して,ロバスト満足度の概念を定義した。
本研究では,STLのフラグメント内の式を満足させる訓練可能な高次制御バリア関数(HOCBF)を構築する。
我々は、他のニューラルネットワークパラメータとともにHOCBFをトレーニングし、コントローラの堅牢性をさらに向上させる。
論文 参考訳(メタデータ) (2023-04-12T21:12:15Z) - Learning Feasibility Constraints for Control Barrier Functions [8.264868845642843]
我々は、擬似プログラム(QP)の実現性を確保するために機械学習技術を採用している。
CBFのための新しい実現可能性制約を学習するためのサンプリングベース学習手法を提案する。
本稿では,制約付き最適制御問題に対する学習手法の利点を示す。
論文 参考訳(メタデータ) (2023-03-10T16:29:20Z) - Improving the Performance of Robust Control through Event-Triggered
Learning [74.57758188038375]
LQR問題における不確実性に直面していつ学習するかを決定するイベントトリガー学習アルゴリズムを提案する。
本研究では,ロバストな制御器ベースライン上での性能向上を数値例で示す。
論文 参考訳(メタデータ) (2022-07-28T17:36:37Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Reach-SDP: Reachability Analysis of Closed-Loop Systems with Neural
Network Controllers via Semidefinite Programming [19.51345816555571]
本稿では,ニューラルネットワークを用いた線形時間変化システムの安全性検証のための新しいフォワードリーチビリティ解析手法を提案する。
半有限計画法を用いて、これらの近似到達可能な集合を計算できることが示される。
提案手法は,まずディープニューラルネットワークを用いて非線形モデル予測制御器を近似し,その解析ツールを用いて閉ループシステムの有限時間到達性と制約満足度を証明した。
論文 参考訳(メタデータ) (2020-04-16T18:48:25Z) - Reinforcement Learning for Safety-Critical Control under Model
Uncertainty, using Control Lyapunov Functions and Control Barrier Functions [96.63967125746747]
強化学習フレームワークは、CBFおよびCLF制約に存在するモデル不確実性を学ぶ。
RL-CBF-CLF-QPは、安全制約におけるモデル不確実性の問題に対処する。
論文 参考訳(メタデータ) (2020-04-16T10:51:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。