論文の概要: Safe Control using Learned Safety Filters and Adaptive Conformal Inference
- arxiv url: http://arxiv.org/abs/2604.18482v1
- Date: Mon, 20 Apr 2026 16:34:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.997478
- Title: Safe Control using Learned Safety Filters and Adaptive Conformal Inference
- Title(参考訳): 学習安全フィルタと適応等角推論を用いた安全制御
- Authors: Sacha Huriot, Ihab Tabbara, Hussein Sibai,
- Abstract要約: 安全フィルタは、安全でない名目上のポリシーで制御システムの安全性を確保する効果的なツールであることが示されている。
本稿では,ハミルトン-ヤコビ到達可能性に基づく安全フィルタと適応型共形推論を組み合わせた適応型コンフォーマルフィルタ(ACoFi)を提案する。
また,ACoFiは,ユーザ定義パラメータによって,予測されたセキュリティ上の不確実性を不正確に定量化することを保証する。
- 参考スコア(独自算出の注目度): 0.8921166277011348
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Safety filters have been shown to be effective tools to ensure the safety of control systems with unsafe nominal policies. To address scalability challenges in traditional synthesis methods, learning-based approaches have been proposed for designing safety filters for systems with high-dimensional state and control spaces. However, the inevitable errors in the decisions of these models raise concerns about their reliability and the safety guarantees they offer. This paper presents Adaptive Conformal Filtering (ACoFi), a method that combines learned Hamilton-Jacobi reachability-based safety filters with adaptive conformal inference. Under ACoFi, the filter dynamically adjusts its switching criteria based on the observed errors in its predictions of the safety of actions. The range of possible safety values of the nominal policy's output is used to quantify uncertainty in safety assessment. The filter switches from the nominal policy to the learned safe one when that range suggests it might be unsafe. We show that ACoFi guarantees that the rate of incorrectly quantifying uncertainty in the predicted safety of the nominal policy is asymptotically upper bounded by a user-defined parameter. This gives a soft safety guarantee rather than a hard safety guarantee. We evaluate ACoFi in a Dubins car simulation and a Safety Gymnasium environment, empirically demonstrating that it significantly outperforms the baseline method that uses a fixed switching threshold by achieving higher learned safety values and fewer safety violations, especially in out-of-distribution scenarios.
- Abstract(参考訳): 安全フィルタは、安全でない名目上のポリシーで制御システムの安全性を確保する効果的なツールであることが示されている。
従来の合成手法におけるスケーラビリティの課題に対処するため,高次元状態と制御空間を持つシステムの安全フィルタ設計のための学習ベースアプローチが提案されている。
しかしながら、これらのモデルの決定における必然的なエラーは、信頼性とそれらが提供する安全保証に関する懸念を引き起こす。
本稿では,ハミルトン-ヤコビ到達可能性に基づく安全フィルタと適応型共形推論を組み合わせた適応型コンフォーマルフィルタ(ACoFi)を提案する。
ACoFiの下では、フィルタは動作の安全性の予測において観測された誤差に基づいて切換基準を動的に調整する。
安全評価における不確実性を定量化するために、名目政策の出力の可能な安全性値の範囲が使用される。
このフィルターは、名目上のポリシーから、その範囲が安全でないことを示唆する学習された安全ポリシーに切り替える。
ACoFiは, 利用者が定義したパラメータで漸近的に上界にあることを保証する。
これにより、ハードセーフティの保証よりもソフトセーフティの保証が提供される。
デュビンス車両シミュレーションおよび安全体育館環境におけるACoFiの評価を行い、特にアウト・オブ・ディストリビューションシナリオにおいて、高い安全性値と少ない安全性違反を達成し、固定切換閾値を使用するベースライン法を著しく上回っていることを実証的に証明した。
関連論文リスト
- Statistically Assuring Safety of Control Systems using Ensembles of Safety Filters and Conformal Prediction [1.5335713879217925]
Hamilton-Jacobi (HJ) 到達可能性解析は、安全を正式に検証し、安全なコントローラを生成するための基本的な方法である。
このような不確実性に縛られる共形予測ベース(CP)フレームワークを導入する。
論文 参考訳(メタデータ) (2025-11-11T06:54:16Z) - Provably Optimal Reinforcement Learning under Safety Filtering [6.197103843323546]
パーミッシブセーフティフィルタによる安全性の強制は、固有の性能を低下させるものではないことを示す。
安全決定プロセス (SC-MDP) により安全を形式化し, 破滅的故障状態を回避するためには, 高い確率ではなくカテゴリー的判断が必要である。
我々の主定理は、 (i) フィルタリングされた MDP における学習は安全な分類であり、 (ii) 標準 RL 収束は、フィルタされた MDP に受け継がれ、 (iii) フィルタされた MDP で最適となる政策は、いずれの政策も決定する。
論文 参考訳(メタデータ) (2025-10-20T20:20:10Z) - Multi-Step Model Predictive Safety Filters: Reducing Chattering by
Increasing the Prediction Horizon [7.55113002732746]
安全フィルタを用いて学習制御ポリシを増強することにより、状態と入力制約の満足度を保証できる。
モデル予測安全フィルタ(MPSF)は、モデル予測制御(MPC)に基づく一般的な安全フィルタリング手法である。
論文 参考訳(メタデータ) (2023-09-20T16:35:29Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Safe Reinforcement Learning via Confidence-Based Filters [78.39359694273575]
我々は,標準的な強化学習技術を用いて学習した名目政策に対して,国家安全の制約を認定するための制御理論的アプローチを開発する。
我々は、正式な安全保証を提供し、我々のアプローチの有効性を実証的に実証する。
論文 参考訳(メタデータ) (2022-07-04T11:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。