論文の概要: Distributionally Robust Safety Under Arbitrary Uncertainties: A Safety Filtering Approach
- arxiv url: http://arxiv.org/abs/2605.12974v2
- Date: Mon, 18 May 2026 23:59:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.263291
- Title: Distributionally Robust Safety Under Arbitrary Uncertainties: A Safety Filtering Approach
- Title(参考訳): 任意不確実性下におけるロバスト分布の安全性:安全フィルタリングアプローチ
- Authors: Daniel M. Cherenson, Haejoon Lee, Taekyung Kim, Dimitra Panagou,
- Abstract要約: 分布あいまいさ下で非線形システムの確率論的安全性を確保する方法について検討する。
提案手法は,安全性を確保するために,高性能な名目ポリシーと認証されたバックアップポリシーを切り替える,バックアップベースの安全フィルタリングフレームワーク上に構築されている。
本手法は,Dubins車から高速レーシングカー,戦闘機まで,3つのシステムを対象としたシミュレーションにより検証する。
- 参考スコア(独自算出の注目度): 11.107547000695646
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we study how to ensure probabilistic safety for nonlinear systems under distributional ambiguity. Our approach builds on a backup-based safety filtering framework that switches between a high-performance nominal policy and a certified backup policy to ensure safety. To handle arbitrary uncertainties from ambiguous distributions, i.e., where the distribution is not of specific structure and the true distribution is unknown, we adopt a distributionally robust (DR) formulation using Wasserstein ambiguity sets. Rather than solving a high-dimensional DR trajectory optimization problem online, we exploit the structure of backup-based safety filtering to reduce safety certification to a one-dimensional search over the switching time between nominal and backup policies. We then develop a sampling-based certification procedure with finite-sample guarantees, where empirical failure probabilities are compared against a Wasserstein-inflated threshold. We validate our method through simulations across three systems, from a Dubins vehicle to a high-speed racing car and a fighter jet, demonstrating the broad applicability and computational efficiency.
- Abstract(参考訳): 本研究では,分散あいまいさ下での非線形システムの確率論的安全性を確保する方法について検討する。
提案手法は,安全性を確保するために,高性能な名目ポリシーと認証されたバックアップポリシーを切り替える,バックアップベースの安全フィルタリングフレームワーク上に構築されている。
不明瞭な分布からの任意の不確実性、すなわち分布が特定の構造ではなく、真の分布が未知であるような問題に対処するために、ワッサーシュタインの曖昧性集合を用いた分布的ロバスト(DR)の定式化を採用する。
我々は,高次元DR軌道最適化問題をオンラインで解く代わりに,バックアップベースの安全フィルタの構造を利用して,名目とバックアップポリシー間の切替時間に関する1次元探索を行う。
次に、有限サンプル保証付きサンプリングベースの認証手法を開発し、ワッサーシュタイン膨張しきい値と経験的故障確率を比較する。
本手法は,Dubins車から高速レーシングカー,戦闘機まで,3つのシステムにまたがるシミュレーションにより検証し,広い適用性と計算効率を実証する。
関連論文リスト
- Safe Reinforcement Learning via Recovery-based Shielding with Gaussian Process Dynamics Models [57.006252510102506]
強化学習(Reinforcement Learning, RL)は、最適な意思決定と制御のための強力なフレームワークである。
本稿では,未知および非線形連続力学系に対する安全性を低くした安全RLを実現するための新しい回復型遮蔽フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T22:03:35Z) - Learning to Navigate Under Imperfect Perception: Conformalised Segmentation for Safe Reinforcement Learning [6.255435016547602]
COPPOLは、コンフォメーション駆動の知覚から政治への学習手法である。
分散のない有限サンプル安全性保証をセマンティックセグメンテーションに統合する。
安全でない領域のほぼ完全な検出を実現し、ナビゲーション中に有害な違反を減らす。
論文 参考訳(メタデータ) (2025-10-21T10:07:04Z) - Rethinking Safety in LLM Fine-tuning: An Optimization Perspective [56.31306558218838]
我々は、本質的にトレードオフではなく、最適化の貧弱な選択が、しばしば安全上の問題を引き起こすことを示し、敵のプロンプトに対する有害な応答として測定する。
安全性能を保ったパラメータ空間における簡易指数移動平均(EMA)運動量法を提案する。
複数のデータセットにまたがるLlamaファミリーに関する実験は、安全性の問題が特別な介入なしに回避できることを実証している。
論文 参考訳(メタデータ) (2025-08-17T23:46:36Z) - Distributed Risk-Sensitive Safety Filters for Uncertain Discrete-Time Systems [39.53920064972246]
本研究では,不確実なダイナミクスを持つ離散時間マルチエージェントシステムに対して,新たなリスク感応性安全フィルタを提案する。
提案手法は, モデル不確実性に対するロバスト性を確保するために, 指数的リスク演算子に基づく集中型安全条件に依存する。
論文 参考訳(メタデータ) (2025-06-09T01:48:25Z) - Learning Predictive Safety Filter via Decomposition of Robust Invariant
Set [6.94348936509225]
本稿では, RMPCとRL RLの併用による非線形システムの安全フィルタの合成について述べる。
本稿では,ロバストリーチ問題に対する政策アプローチを提案し,その複雑性を確立する。
論文 参考訳(メタデータ) (2023-11-12T08:11:28Z) - Distributionally Safe Reinforcement Learning under Model Uncertainty: A
Single-Level Approach by Differentiable Convex Programming [4.825619788907192]
We present a tractable distributionally safe reinforcement learning framework to enforce safety under a distributional shift by a Wasserstein metric。
トラクタビリティを向上させるために、まず双対性理論を用いて、低次最適化を無限次元確率空間から有限次元パラメトリック空間に変換する。
微分可能凸プログラミングにより、二段階安全な学習問題は、さらに2つの逐次計算効率のモジュールを持つ1つのレベルに削減される。
論文 参考訳(メタデータ) (2023-10-03T22:05:05Z) - CaRT: Certified Safety and Robust Tracking in Learning-based Motion
Planning for Multi-Agent Systems [7.77024796789203]
CaRTは、学習ベースのモーションプランニングポリシーの安全性と堅牢性を保証するために、新しい階層的な分散アーキテクチャである。
定性障害や有界障害があっても,CaRTは軌道追跡誤差の安全性と指数関数性を保証する。
本稿では, 非線形動作計画と制御問題のいくつかの例において, CaRTの有効性を実証する。
論文 参考訳(メタデータ) (2023-07-13T21:51:29Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Safe Reinforcement Learning via Confidence-Based Filters [78.39359694273575]
我々は,標準的な強化学習技術を用いて学習した名目政策に対して,国家安全の制約を認定するための制御理論的アプローチを開発する。
我々は、正式な安全保証を提供し、我々のアプローチの有効性を実証的に実証する。
論文 参考訳(メタデータ) (2022-07-04T11:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。