論文の概要: Synthesis and Deployment of Maximal Robust Control Barrier Functions through Adversarial Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2604.13192v1
- Date: Tue, 14 Apr 2026 18:16:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.246628
- Title: Synthesis and Deployment of Maximal Robust Control Barrier Functions through Adversarial Reinforcement Learning
- Title(参考訳): 対向強化学習による最大ロバスト制御バリア関数の合成と展開
- Authors: Donggeon David Oh, Duy P. Nguyen, Haimin Hu, Jaime Fernández Fisac,
- Abstract要約: 境界不確実性下での一般非線形システムのための新しい頑健なCBFフレームワークを提案する。
まず、動的プログラミングのアイザック方程式を解く安全値関数は、最大ロバストな安全集合に対する安全性を強制する有効なロバストな離散時間CBFであることを示す。
次に、バリア証明書を状態-作用空間に持ち上げることにより、明示的なダイナミクスの必要性を解消する、品質関数(RL)の重要な強化学習概念を採用する。
- 参考スコア(独自算出の注目度): 4.062182903323153
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robust control barrier functions (CBFs) provide a principled mechanism for smooth safety enforcement under worst-case disturbances. However, existing approaches typically rely on explicit, closed-form structure in the dynamics (e.g., control-affine) and uncertainty models. This has led to limited scalability and generality, with most robust CBFs certifying only conservative subsets of the maximal robust safe set. In this paper, we introduce a new robust CBF framework for general nonlinear systems under bounded uncertainty. We first show that the safety value function solving the dynamic programming Isaacs equation is a valid robust discrete-time CBF that enforces safety on the maximal robust safe set. We then adopt the key reinforcement learning (RL) notion of quality function (or Q-function), which removes the need for explicit dynamics by lifting the barrier certificate into state-action space and yields a novel robust Q-CBF constraint for safety filtering. Combined with adversarial RL, this enables the synthesis and deployment of robust Q-CBFs on general nonlinear systems with black-box dynamics and unknown uncertainty structure. We validate the framework on a canonical inverted pendulum benchmark and a 36-D quadruped simulator, achieving substantially less conservative safe sets than barrier-based baselines on the pendulum and reliable safety enforcement even under adversarial uncertainty realizations on the quadruped.
- Abstract(参考訳): ロバスト制御バリア関数(CBF)は、最悪の場合の安全対策を円滑に行うための原則的なメカニズムを提供する。
しかし、既存のアプローチは典型的には、ダイナミックス(例えば、制御-アフィン)や不確実性モデルにおける明示的で閉形式構造に依存している。
これはスケーラビリティと汎用性に限界をもたらし、ほとんどの頑健なCBFは極大頑健な安全な集合の保守的な部分集合のみを証明している。
本稿では,境界不確実性の下での一般非線形システムのための新しいロバストCBFフレームワークを提案する。
まず、動的プログラミングのアイザック方程式を解く安全値関数は、最大ロバストな安全集合に対する安全性を強制する有効なロバストな離散時間CBFであることを示す。
次に、品質関数(Q関数)というキー強化学習(RL)の概念を採用し、バリア証明書を状態-作用空間に持ち上げることにより、明示的なダイナミクスの必要性を排除し、安全フィルタリングのための新しい堅牢なQ-CBF制約を与える。
逆数RLと組み合わせることで、ブラックボックス力学と未知の不確実構造を持つ一般的な非線形システム上で、堅牢なQ-CBFの合成と展開が可能になる。
本手法を正準逆振り子ベンチマークと36次元四重極子シミュレータで検証し,四重極子上でのバリアベースベースラインよりも極めて保守的な安全セットを実現し,四重極子上での逆不確実性の実現においても信頼性の高い安全性確保を実現する。
関連論文リスト
- BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - ORN-CBF: Learning Observation-conditioned Residual Neural Control Barrier Functions via Hypernetworks [2.7458654644827134]
制御障壁関数 (CBF) は自律システムの安全クリティカル制御の有効な方法として実証されている。
ハミルトン・ヤコビ(HJ)の到達可能性解析に基づく観測条件付きニューラルCBFを提案する。
論文 参考訳(メタデータ) (2025-09-20T10:29:36Z) - Reachability Barrier Networks: Learning Hamilton-Jacobi Solutions for Smooth and Flexible Control Barrier Functions [5.846607930201535]
制御バリア関数(CBF)は、一般的な制御フレームワークに安全保証を付加する一般的な方法である。
物理インフォームドニューラルネットワーク(PINN)を用いて,ハミルトン・ヤコビ最適制御解の計算によりCBFのスムーズな近似を生成する。
我々は、RBNは低次元において非常に正確であり、高次元における標準的な神経CBFアプローチよりも安全であることを示した。
論文 参考訳(メタデータ) (2025-05-16T23:30:13Z) - Pareto Control Barrier Function for Inner Safe Set Maximization Under Input Constraints [50.920465513162334]
入力制約下での動的システムの内部安全集合を最大化するPCBFアルゴリズムを提案する。
逆振り子に対するハミルトン・ヤコビの到達性との比較と,12次元四元数系のシミュレーションにより,その有効性を検証する。
その結果,PCBFは既存の手法を一貫して上回り,入力制約下での安全性を確保した。
論文 参考訳(メタデータ) (2024-10-05T18:45:19Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Reinforcement Learning for Safety-Critical Control under Model
Uncertainty, using Control Lyapunov Functions and Control Barrier Functions [96.63967125746747]
強化学習フレームワークは、CBFおよびCLF制約に存在するモデル不確実性を学ぶ。
RL-CBF-CLF-QPは、安全制約におけるモデル不確実性の問題に対処する。
論文 参考訳(メタデータ) (2020-04-16T10:51:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。