論文の概要: Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty
- arxiv url: http://arxiv.org/abs/2604.03868v1
- Date: Sat, 04 Apr 2026 21:22:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.80591
- Title: Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty
- Title(参考訳): 潜在不確実性下における安全制御のためのリスク制約された信念空間最適化
- Authors: Clinton Enwerem, John S. Baras, Calin Belta,
- Abstract要約: 多くの安全クリティカル制御システムは、センサーが決定時に直接解決できないという遅延不確実性の下で動作しなければならない。
標準的な手法は期待されたパフォーマンスを最適化し、稀だが深刻な結果に対する限定的な保護を提供する。
本稿では, 力学, コスト, 安全性の制約が, 信念分布として維持される潜在パラメータに依存する, 部分的に観察された力学系について考察する。
- 参考スコア(独自算出の注目度): 5.99447754429793
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many safety-critical control systems must operate under latent uncertainty that sensors cannot directly resolve at decision time. Such uncertainty, arising from unknown physical properties, exogenous disturbances, or unobserved environment geometry, influences dynamics, task feasibility, and safety margins. Standard methods optimize expected performance and offer limited protection against rare but severe outcomes, while robust formulations treat uncertainty conservatively without exploiting its probabilistic structure. We consider partially observed dynamical systems whose dynamics, costs, and safety constraints depend on a latent parameter maintained as a belief distribution, and propose a risk-sensitive belief-space Model Predictive Path Integral (MPPI) control framework that plans under this belief while enforcing a Conditional Value-at-Risk (CVaR) constraint on a trajectory safety margin over the receding horizon. The resulting controller optimizes a risk-regularized performance objective while explicitly constraining the tail risk of safety violations induced by latent parameter variability. We establish three properties of the resulting risk-constrained controller: (1) the CVaR constraint implies a probabilistic safety guarantee, (2) the controller recovers the risk-neutral optimum as the risk weight in the objective tends to zero, and (3) a union-bound argument extends the per-horizon guarantee to cumulative safety over repeated solves. In physics-based simulations of a vision-guided dexterous stowing task in which a grasped object must be inserted into an occupied slot with pose uncertainty exceeding prescribed lateral clearance requirements, our method achieves 82% success with zero contact violations at high risk aversion, compared to 55% and 50% for a risk-neutral configuration and a chance-constrained baseline, both of which incur nonzero exterior contact forces.
- Abstract(参考訳): 多くの安全クリティカル制御システムは、センサーが決定時に直接解決できないという遅延不確実性の下で動作しなければならない。
このような不確実性は、未知の物理的性質、外因性障害、または観測されていない環境幾何学から生じ、力学、タスク実現可能性、安全マージンに影響を及ぼす。
標準的な手法は期待された性能を最適化し、稀だが厳しい結果に対する限定的な保護を提供するが、頑健な定式化は確率的構造を使わずに不確実性を扱う。
本研究では, 信頼分布として維持される潜在パラメータに依存する動的力学系を部分的に考察し, 軌道上の安全マージンに条件付き値-リスク(CVaR)制約を課しながら, この信念に基づいて計画する, リスクに敏感な信頼空間モデル予測パス積分(MPPI)制御フレームワークを提案する。
得られた制御器は、潜時パラメータ変動により生じる安全違反のテールリスクを明示的に制約しつつ、リスク調整された性能目標を最適化する。
1)CVaR制約は確率的安全性を保証すること,(2)コントローラは目標のリスク重みがゼロになる傾向にある場合,リスクニュートラル最適度を回復すること,(3)ユニオンバウンドの議論は,繰り返し解よりも水平あたりの保証を累積安全に拡張すること,の3つの特性を確立する。
本手法は, 被拘束物体を占領スロットに挿入し, 所定の側方クリアランス要件を超える不確実性を生じさせるような視覚誘導整形作業の物理シミュレーションにおいて, リスクニュートラル構成の55%と50%に対して, リスク回避時にゼロ接触違反を伴って82%の成功を達成し, いずれも非ゼロ外部接触力を有する確率拘束ベースラインである。
関連論文リスト
- MPC as a Copilot: A Predictive Filter Framework with Safety and Stability Guarantees [6.019901994880397]
本稿では,単一アーキテクチャにおける制約満足度と安定性を保証する統一型予測フィルタフレームワークである予測安全安定フィルタ(PS2F)を紹介する。
PS2Fフレームワークは、2つのカスケードされた最適制御問題から成り、コピロットとしてのみ機能する名目モデル予測制御(MPC)層と、確実に安全で安定した領域に留まるように外部コマンドを調整する二次フィルタリング層とから構成される。
論文 参考訳(メタデータ) (2026-03-29T22:17:39Z) - Response-Aware Risk-Constrained Control Barrier Function With Application to Vehicles [0.0]
本稿では,車両の動的安全境界制御のための応答認識型リスク制約制御バリア関数に基づく統合制御フレームワークを提案する。
このフレームワークは、制御勾配の基準方向を提供するために、名目力学と直接車体応答を融合する。
また、従来の決定論的安全制約をバリア関数誘導体のテールリスクに関する確率論的制約に再構成する。
論文 参考訳(メタデータ) (2026-03-13T02:38:17Z) - Statistical Contraction for Chance-Constrained Trajectory Optimization of Non-Gaussian Stochastic Systems [0.0]
このフレームワークは共形推論を用いて任意の参照軌跡を囲む閉ループ力学に対する信頼セットを生成する。
適切な制約の締め付けにより、基準軌跡上の統計的に妥当な決定論的制約をトラクタブルに修正することができる。
これにより、安全クリティカルな現実世界のアプリケーションにおいて、ニューラルネットワークメトリクスのような学習ベースのモーションプランナとコントローラを活用、検証するフォーマルなパスが可能になる。
論文 参考訳(メタデータ) (2026-03-07T08:01:20Z) - Safe Reinforcement Learning via Recovery-based Shielding with Gaussian Process Dynamics Models [57.006252510102506]
強化学習(Reinforcement Learning, RL)は、最適な意思決定と制御のための強力なフレームワークである。
本稿では,未知および非線形連続力学系に対する安全性を低くした安全RLを実現するための新しい回復型遮蔽フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T22:03:35Z) - Conformal Reachability for Safe Control in Unknown Environments [29.315278038378835]
未知の力学系に対する確率的検証フレームワークを開発した。
共形予測を用いて,各段階における未知のダイナミクスに対する有効不確実区間を求める。
また,計画の地平線を最大化しつつ,名目報酬を最適化する制御ポリシーの学習手法も開発している。
論文 参考訳(メタデータ) (2026-02-03T18:01:38Z) - Constrained Language Model Policy Optimization via Risk-aware Stepwise Alignment [49.2305683068875]
本稿では,リスク認識を政策最適化プロセスに組み込んだ新しいアライメント手法であるリスク対応ステップワイドアライメント(RSA)を提案する。
RSAは、過剰なモデルシフトによって引き起こされるリスクを基準方針から緩和し、低確率で高影響の有害な振る舞いを明示的に抑制する。
実験により, 本手法は高い安全性を確保しつつ, 高い安全性を達成できることが確認された。
論文 参考訳(メタデータ) (2025-12-30T14:38:02Z) - Rectified Robust Policy Optimization for Model-Uncertain Constrained Reinforcement Learning without Strong Duality [53.525547349715595]
我々はRectified Robust Policy Optimization (RRPO) と呼ばれる新しいプライマリのみのアルゴリズムを提案する。
RRPOは双対の定式化に頼ることなく、主問題に直接作用する。
我々は、最もよく知られた下界と一致する複雑性を持つ、ほぼ最適な実現可能なポリシーに収束することを示す。
論文 参考訳(メタデータ) (2025-08-24T16:59:38Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Risk Sensitive Model-Based Reinforcement Learning using Uncertainty
Guided Planning [0.0]
本稿では,モデルに基づく強化学習アルゴリズムでリスク感度を向上する。
本研究では,高分散状態予測をもたらす行動系列を解析する不確実性誘導型クロスエントロピー法計画を提案する。
実験では、エージェントが計画中の状態空間の不確実な領域を識別し、エージェントを高い信頼領域内に保持する行動をとる能力を示す。
論文 参考訳(メタデータ) (2021-11-09T07:28:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。