論文の概要: On the Optimality, Stability, and Feasibility of Control Barrier
Functions: An Adaptive Learning-Based Approach
- arxiv url: http://arxiv.org/abs/2305.03608v1
- Date: Fri, 5 May 2023 15:11:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-08 13:34:02.102768
- Title: On the Optimality, Stability, and Feasibility of Control Barrier
Functions: An Adaptive Learning-Based Approach
- Title(参考訳): 適応学習に基づく制御障壁関数の最適性、安定性、実現可能性について
- Authors: Alaa Eddine Chriat and Chuangchuang Sun
- Abstract要約: 制御バリア機能(CBF)とその変種は、安全クリティカルな制御のために広く注目を集めている。
現在のCBFには、最適性、安定性、実現可能性という根本的な制限がある。
本稿では,適応多段階制御バリア関数 (AM-CBF) を提案し,ニューラルネットワークを用いてクラス$mathcalK$関数をパラメータ化し,強化学習ポリシーとともに学習する。
- 参考スコア(独自算出の注目度): 4.399563188884702
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Safety has been a critical issue for the deployment of learning-based
approaches in real-world applications. To address this issue, control barrier
function (CBF) and its variants have attracted extensive attention for
safety-critical control. However, due to the myopic one-step nature of CBF and
the lack of principled methods to design the class-$\mathcal{K}$ functions,
there are still fundamental limitations of current CBFs: optimality, stability,
and feasibility. In this paper, we proposed a novel and unified approach to
address these limitations with Adaptive Multi-step Control Barrier Function
(AM-CBF), where we parameterize the class-$\mathcal{K}$ function by a neural
network and train it together with the reinforcement learning policy. Moreover,
to mitigate the myopic nature, we propose a novel \textit{multi-step training
and single-step execution} paradigm to make CBF farsighted while the execution
remains solving a single-step convex quadratic program. Our method is evaluated
on the first and second-order systems in various scenarios, where our approach
outperforms the conventional CBF both qualitatively and quantitatively.
- Abstract(参考訳): 安全性は、現実世界のアプリケーションに学習ベースのアプローチを配置する上で重要な問題である。
この問題に対処するため、制御バリア機能(cbf)とその変種は安全クリティカルな制御に広く注目を集めている。
しかし、CBFの筋電図的な一段階の性質とクラス-$\mathcal{K}$関数を設計する原理的な方法の欠如により、現在のCBFには、最適性、安定性、実現可能性という根本的な制限がある。
本稿では,ニューラルネットワークを用いてクラス-$\mathcal{k}$関数をパラメータ化し,強化学習ポリシーとともに学習する適応型多段階制御障壁関数(am-cbf)を用いて,これらの制約に対処するための新しい統一的手法を提案する。
さらに, 筋覚特性を緩和するために, 単段凸二次プログラムを解き続けるcbfを遠視化するために, 新たな \textit{multi-step training and single-step execution}パラダイムを提案する。
提案手法は,従来のCBFよりも質的,定量的に優れる,様々なシナリオにおいて,第1次および第2次システムで評価される。
関連論文リスト
- Domain Adaptive Safety Filters via Deep Operator Learning [5.62479170374811]
本稿では,環境パラメータから対応するCBFへのマッピングを学習する自己教師型深層演算子学習フレームワークを提案する。
動的障害物を含むナビゲーションタスクの数値実験により,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2024-10-18T15:10:55Z) - One-Shot Safety Alignment for Large Language Models via Optimal Dualization [64.52223677468861]
本稿では,制約付きアライメントを等価な非制約アライメント問題に還元する双対化の観点を提案する。
我々は、閉形式を持つ滑らかで凸な双対函数を事前に最適化する。
我々の戦略は、モデルベースと嗜好ベースの設定における2つの実用的なアルゴリズムに導かれる。
論文 参考訳(メタデータ) (2024-05-29T22:12:52Z) - Reinforcement Learning-based Receding Horizon Control using Adaptive Control Barrier Functions for Safety-Critical Systems [14.166970599802324]
最適制御法は、安全クリティカルな問題に対する解決策を提供するが、容易に難解になる。
モデル予測制御を利用した強化学習に基づく回帰水平制御手法を提案する。
我々は、コネクテッド・アンド・オートマチック・ビークルにおける自動マージ制御問題に適用し、本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-03-26T02:49:08Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Learning Feasibility Constraints for Control Barrier Functions [8.264868845642843]
我々は、擬似プログラム(QP)の実現性を確保するために機械学習技術を採用している。
CBFのための新しい実現可能性制約を学習するためのサンプリングベース学習手法を提案する。
本稿では,制約付き最適制御問題に対する学習手法の利点を示す。
論文 参考訳(メタデータ) (2023-03-10T16:29:20Z) - Stochastic Methods for AUC Optimization subject to AUC-based Fairness
Constraints [51.12047280149546]
公正な予測モデルを得るための直接的なアプローチは、公正な制約の下で予測性能を最適化することでモデルを訓練することである。
フェアネスを考慮した機械学習モデルのトレーニング問題を,AUCに基づくフェアネス制約のクラスを対象とする最適化問題として定式化する。
フェアネス測定値の異なる実世界のデータに対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-12-23T22:29:08Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - Safe Exploration in Model-based Reinforcement Learning using Control
Barrier Functions [1.005130974691351]
我々は、最小侵襲の安全管理ポリシーを開発するためにCBFの有益な特性を保持する新しいCBFのクラスを開発する。
我々は,これらのlcbfを学習ベースの制御ポリシーの強化に活用し,安全性を保証し,このアプローチを利用して安全な探索フレームワークを開発する方法を示す。
論文 参考訳(メタデータ) (2021-04-16T15:29:58Z) - Reinforcement Learning for Safety-Critical Control under Model
Uncertainty, using Control Lyapunov Functions and Control Barrier Functions [96.63967125746747]
強化学習フレームワークは、CBFおよびCLF制約に存在するモデル不確実性を学ぶ。
RL-CBF-CLF-QPは、安全制約におけるモデル不確実性の問題に対処する。
論文 参考訳(メタデータ) (2020-04-16T10:51:33Z) - Learning Control Barrier Functions from Expert Demonstrations [69.23675822701357]
制御障壁関数(CBF)に基づく安全な制御器合成のための学習に基づくアプローチを提案する。
最適化に基づくCBFの学習手法を解析し、基礎となる力学系のリプシッツ仮定の下で証明可能な安全保証を享受する。
私たちの知る限りでは、これらはデータから確実に安全な制御障壁関数を学習する最初の結果です。
論文 参考訳(メタデータ) (2020-04-07T12:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。