論文の概要: V-OCBF: Learning Safety Filters from Offline Data via Value-Guided Offline Control Barrier Functions
- arxiv url: http://arxiv.org/abs/2512.10822v1
- Date: Thu, 11 Dec 2025 17:14:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.482548
- Title: V-OCBF: Learning Safety Filters from Offline Data via Value-Guided Offline Control Barrier Functions
- Title(参考訳): V-OCBF:値誘導オフライン制御バリア関数によるオフラインデータからの安全フィルタの学習
- Authors: Mumuksh Tayal, Manan Tayal, Aditya Singh, Shishir Kolathaya, Ravi Prakash,
- Abstract要約: V-OCBF(Value-Guided Offline Control Barrier Function)を導入する。
オフラインデモから完全にニューラルネットワークCBFを学習する。
基準法よりも安全性違反が著しく少ない。
- 参考スコア(独自算出の注目度): 8.042484673796137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensuring safety in autonomous systems requires controllers that satisfy hard, state-wise constraints without relying on online interaction. While existing Safe Offline RL methods typically enforce soft expected-cost constraints, they do not guarantee forward invariance. Conversely, Control Barrier Functions (CBFs) provide rigorous safety guarantees but usually depend on expert-designed barrier functions or full knowledge of the system dynamics. We introduce Value-Guided Offline Control Barrier Functions (V-OCBF), a framework that learns a neural CBF entirely from offline demonstrations. Unlike prior approaches, V-OCBF does not assume access to the dynamics model; instead, it derives a recursive finite-difference barrier update, enabling model-free learning of a barrier that propagates safety information over time. Moreover, V-OCBF incorporates an expectile-based objective that avoids querying the barrier on out-of-distribution actions and restricts updates to the dataset-supported action set. The learned barrier is then used with a Quadratic Program (QP) formulation to synthesize real-time safe control. Across multiple case studies, V-OCBF yields substantially fewer safety violations than baseline methods while maintaining strong task performance, highlighting its scalability for offline synthesis of safety-critical controllers without online interaction or hand-engineered barriers.
- Abstract(参考訳): 自律システムの安全性を保証するには、オンラインインタラクションに頼ることなく、厳しい状態制約を満たすコントローラが必要である。
既存の Safe Offline RL メソッドは一般的にソフトなコスト制約を強制するが、前方の不変性は保証しない。
逆に、制御バリア関数(CBF)は厳格な安全保証を提供するが、通常は専門家が設計したバリア関数やシステムダイナミクスの完全な知識に依存している。
本稿では、オフラインデモから完全にニューラルネットワークCBFを学習するフレームワークであるValue-Guided Offline Control Barrier Functions (V-OCBF)を紹介する。
従来のアプローチとは異なり、V-OCBFはダイナミックスモデルへのアクセスを前提とせず、再帰的な有限差分バリア更新を導出し、時間とともに安全情報を伝達するバリアのモデルフリー学習を可能にする。
さらに、V-OCBFは、ディストリビューション外のアクションのバリアのクエリを回避し、データセットをサポートするアクションセットへの更新を制限する、期待値ベースの目的を組み込んでいる。
学習された障壁は、リアルタイム安全な制御を合成するために擬似プログラム(QP)の定式化と共に使用される。
複数のケーススタディの中で、V-OCBFは、オンラインインタラクションや手作業による障壁のない安全クリティカルコントローラをオフラインで合成するスケーラビリティを強調しながら、高いタスク性能を維持しながら、ベースラインメソッドよりも安全性違反を著しく少なくする。
関連論文リスト
- Learning Neural Control Barrier Functions from Expert Demonstrations using Inverse Constraint Learning [1.7235805533661985]
我々は、安全、すなわち制御された前方不変集合に属することを考慮し、システムの状態を分類する制約関数を訓練する。
次に、その関数を使用して、新しいシミュレートされた軌道のセットをラベル付けし、神経CBFをトレーニングします。
4つの異なる環境において、我々のアプローチを実証的に評価し、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-24T15:20:34Z) - Reachability Barrier Networks: Learning Hamilton-Jacobi Solutions for Smooth and Flexible Control Barrier Functions [5.846607930201535]
制御バリア関数(CBF)は、一般的な制御フレームワークに安全保証を付加する一般的な方法である。
物理インフォームドニューラルネットワーク(PINN)を用いて,ハミルトン・ヤコビ最適制御解の計算によりCBFのスムーズな近似を生成する。
我々は、RBNは低次元において非常に正確であり、高次元における標準的な神経CBFアプローチよりも安全であることを示した。
論文 参考訳(メタデータ) (2025-05-16T23:30:13Z) - Pareto Control Barrier Function for Inner Safe Set Maximization Under Input Constraints [50.920465513162334]
入力制約下での動的システムの内部安全集合を最大化するPCBFアルゴリズムを提案する。
逆振り子に対するハミルトン・ヤコビの到達性との比較と,12次元四元数系のシミュレーションにより,その有効性を検証する。
その結果,PCBFは既存の手法を一貫して上回り,入力制約下での安全性を確保した。
論文 参考訳(メタデータ) (2024-10-05T18:45:19Z) - Learning Performance-Oriented Control Barrier Functions Under Complex Safety Constraints and Limited Actuation [5.62479170374811]
制御バリア関数(CBF)は非線形制御系力学を制約するエレガントなフレームワークを提供する。
これらの課題に包括的に対処する,新たな自己教師型学習フレームワークを導入する。
本研究では,2次元ダブルインテグレータ(DI)システムと7次元固定翼航空機システムに対するアプローチを検証する。
論文 参考訳(メタデータ) (2024-01-11T02:51:49Z) - Safe Neural Control for Non-Affine Control Systems with Differentiable
Control Barrier Functions [58.19198103790931]
本稿では,非アフィン制御系における安全クリティカル制御の問題に対処する。
制御バリア関数(CBF)を用いて,状態制約と制御制約の2次コストの最適化を2次プログラムのシーケンス(QP)にサブ最適化できることが示されている。
我々は,高次CBFをニューラル常微分方程式に基づく学習モデルに差分CBFとして組み込んで,非アフィン制御系の安全性を保証する。
論文 参考訳(メタデータ) (2023-09-06T05:35:48Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - BarrierNet: A Safety-Guaranteed Layer for Neural Networks [50.86816322277293]
BarrierNetは、ニューラルコントローラの安全性の制約が環境の変化に適応できるようにする。
本研究では,2次元空間と3次元空間における交通統合やロボットナビゲーションといった一連の制御問題について評価する。
論文 参考訳(メタデータ) (2021-11-22T15:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。