論文の概要: Statistically Assuring Safety of Control Systems using Ensembles of Safety Filters and Conformal Prediction
- arxiv url: http://arxiv.org/abs/2511.07899v2
- Date: Thu, 20 Nov 2025 04:28:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 15:01:03.059124
- Title: Statistically Assuring Safety of Control Systems using Ensembles of Safety Filters and Conformal Prediction
- Title(参考訳): 安全フィルタの組合わせと等角予測を用いた制御系の統計的安全性保証
- Authors: Ihab Tabbara, Yuxuan Yang, Hussein Sibai,
- Abstract要約: Hamilton-Jacobi (HJ) 到達可能性解析は、安全を正式に検証し、安全なコントローラを生成するための基本的な方法である。
このような不確実性に縛られる共形予測ベース(CP)フレームワークを導入する。
- 参考スコア(独自算出の注目度): 1.5335713879217925
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Safety assurance is a fundamental requirement for deploying learning-enabled autonomous systems. Hamilton-Jacobi (HJ) reachability analysis is a fundamental method for formally verifying safety and generating safe controllers. However, computing the HJ value function that characterizes the backward reachable set (BRS) of a set of user-defined failure states is computationally expensive, especially for high-dimensional systems, motivating the use of reinforcement learning approaches to approximate the value function. Unfortunately, a learned value function and its corresponding safe policy are not guaranteed to be correct. The learned value function evaluated at a given state may not be equal to the actual safety return achieved by following the learned safe policy. To address this challenge, we introduce a conformal prediction-based (CP) framework that bounds such uncertainty. We leverage CP to provide probabilistic safety guarantees when using learned HJ value functions and policies to prevent control systems from reaching failure states. Specifically, we use CP to calibrate the switching between the unsafe nominal controller and the learned HJ-based safe policy and to derive safety guarantees under this switched policy. We also investigate using an ensemble of independently trained HJ value functions as a safety filter and compare this ensemble approach to using individual value functions alone.
- Abstract(参考訳): 安全保証は、学習可能な自律システムを展開するための基本的な要件である。
Hamilton-Jacobi (HJ) 到達可能性解析は、安全を正式に検証し、安全なコントローラを生成するための基本的な方法である。
しかし,一組のユーザ定義障害状態の後方到達可能集合(BRS)を特徴付けるHJ値関数の計算は,特に高次元システムでは計算コストがかかり,その値関数を近似するために強化学習アプローチを用いる。
残念ながら、学習した値関数とその対応する安全ポリシーは正しいと保証されていない。
与えられた状態で評価された学習値関数は、学習された安全ポリシーに従って達成された実際の安全リターンと等しくならない。
この課題に対処するために、そのような不確実性に縛られる共形予測ベース(CP)フレームワークを導入する。
学習したHJ値関数とポリシを使用して制御系が障害状態に達するのを防ぐ場合、CPを活用して確率論的安全性を保証する。
具体的には、安全でない名目コントローラと学習したHJベースの安全ポリシーとの切り替えを校正するためにCPを使用し、この変更されたポリシーの下で安全保証を導出する。
また、独立に訓練されたHJ値関数のアンサンブルを安全フィルタとして使用し、このアンサンブルアプローチを個々の値関数のみを用いて比較する。
関連論文リスト
- A Physics-Informed Machine Learning Framework for Safe and Optimal Control of Autonomous Systems [8.347548017994178]
安全性とパフォーマンスは競合する目標になり得るため、共同最適化が難しくなる。
本稿では,性能目標をコスト関数で符号化し,安全性要件を状態制約として課す,状態制約付き最適制御問題を提案する。
結果値関数はハミルトン・ヤコビ・ベルマン方程式を満たすことを示した。
論文 参考訳(メタデータ) (2025-02-16T09:46:17Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Safe Reinforcement Learning via Confidence-Based Filters [78.39359694273575]
我々は,標準的な強化学習技術を用いて学習した名目政策に対して,国家安全の制約を認定するための制御理論的アプローチを開発する。
我々は、正式な安全保証を提供し、我々のアプローチの有効性を実証的に実証する。
論文 参考訳(メタデータ) (2022-07-04T11:43:23Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。