論文の概要: Differentiable Safe Controller Design through Control Barrier Functions
- arxiv url: http://arxiv.org/abs/2209.10034v1
- Date: Tue, 20 Sep 2022 23:03:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 17:27:27.533154
- Title: Differentiable Safe Controller Design through Control Barrier Functions
- Title(参考訳): 制御バリア関数による可変安全制御器の設計
- Authors: Shuo Yang, Shaoru Chen, Victor M. Preciado, Rahul Mangharam
- Abstract要約: 学習ベースのコントローラは、高い経験的性能を示すことができるが、正式な安全保証がない。
制御障壁関数(CBF)は、学習ベースコントローラの出力を監視・修正するための安全フィルタとして応用されている。
本稿では,CBF ベースの安全層を識別可能な NN コントローラを提案する。
- 参考スコア(独自算出の注目度): 8.283758049749782
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based controllers, such as neural network (NN) controllers, can show
high empirical performance but lack formal safety guarantees. To address this
issue, control barrier functions (CBFs) have been applied as a safety filter to
monitor and modify the outputs of learning-based controllers in order to
guarantee the safety of the closed-loop system. However, such modification can
be myopic with unpredictable long-term effects. In this work, we propose a
safe-by-construction NN controller which employs differentiable CBF-based
safety layers, and investigate the performance of safe-by-construction NN
controllers in learning-based control. Specifically, two formulations of
controllers are compared: one is projection-based and the other relies on our
proposed set-theoretic parameterization. Both methods demonstrate improved
closed-loop performance over using CBF as a separate safety filter in numerical
experiments.
- Abstract(参考訳): ニューラルネットワーク(NN)コントローラのような学習ベースのコントローラは、経験的なパフォーマンスを示すが、正式な安全保証がない。
この問題に対処するため、制御障壁関数(CBF)は、閉ループシステムの安全性を保証するために、学習ベースコントローラの出力を監視・修正するための安全フィルタとして適用されている。
しかし、このような修正は予測不能な長期的な影響を伴う近視的変化である。
そこで本研究では,cbfベースの安全層を用いた安全バイコンストラクションnnコントローラを提案し,学習ベース制御における安全バイコンストラクションnnコントローラの性能について検討する。
具体的には、二つの制御器の定式化を比較し、一方は射影ベースであり、もう一方は提案する集合論的パラメータ化に依存する。
いずれの手法も、数値実験においてCBFを別個の安全フィルタとして用いるよりもクローズドループ性能が向上したことを示す。
関連論文リスト
- Pareto Control Barrier Function for Inner Safe Set Maximization Under Input Constraints [50.920465513162334]
入力制約下での動的システムの内部安全集合を最大化するPCBFアルゴリズムを提案する。
逆振り子に対するハミルトン・ヤコビの到達性との比較と,12次元四元数系のシミュレーションにより,その有効性を検証する。
その結果,PCBFは既存の手法を一貫して上回り,入力制約下での安全性を確保した。
論文 参考訳(メタデータ) (2024-10-05T18:45:19Z) - Reinforcement Learning-based Receding Horizon Control using Adaptive Control Barrier Functions for Safety-Critical Systems [14.166970599802324]
最適制御法は、安全クリティカルな問題に対する解決策を提供するが、容易に難解になる。
モデル予測制御を利用した強化学習に基づく回帰水平制御手法を提案する。
我々は、コネクテッド・アンド・オートマチック・ビークルにおける自動マージ制御問題に適用し、本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-03-26T02:49:08Z) - Multi-Step Model Predictive Safety Filters: Reducing Chattering by
Increasing the Prediction Horizon [7.55113002732746]
安全フィルタを用いて学習制御ポリシを増強することにより、状態と入力制約の満足度を保証できる。
モデル予測安全フィルタ(MPSF)は、モデル予測制御(MPC)に基づく一般的な安全フィルタリング手法である。
論文 参考訳(メタデータ) (2023-09-20T16:35:29Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Enforcing robust control guarantees within neural network policies [76.00287474159973]
本稿では、ニューラルネットワークによってパラメータ化され、ロバスト制御と同じ証明可能なロバスト性基準を適用した、一般的な非線形制御ポリシークラスを提案する。
提案手法は,複数の領域において有効であり,既存のロバスト制御法よりも平均ケース性能が向上し,(非ロバスト)深部RL法よりも最悪のケース安定性が向上した。
論文 参考訳(メタデータ) (2020-11-16T17:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。