論文の概要: Chance-Constrained MPPI under State and Dynamic Object Prediction Uncertainty and the Evaluation of Collision Risk Calibration
- arxiv url: http://arxiv.org/abs/2605.28330v1
- Date: Wed, 27 May 2026 11:32:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.006938
- Title: Chance-Constrained MPPI under State and Dynamic Object Prediction Uncertainty and the Evaluation of Collision Risk Calibration
- Title(参考訳): 状態および動的物体予測の不確かさ下における環境制約MPPIと衝突リスク校正の評価
- Authors: Benjamin Serfling, Konrad Doll, Kati Radkhah-Lens,
- Abstract要約: 自律ナビゲーションのためのリアルタイム・リスク対応計画アーキテクチャを提案する。
このフレームワークは、1管の Unscented Transform (UT) 近似によるローカライゼーションの不確実性とモンテカルロ凝集による動的障害物予測の不確実性を統合する。
高度に散らばった環境では、DUCCT-MPPIは優れた堅牢性を達成し、確立されたモンテカルロMPPIベースラインを約28%上回った。
- 参考スコア(独自算出の注目度): 1.8352113484137627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chance-constrained Model Predictive Path Integral (MPPI) control is increasingly adopted for navigation in dynamic environments to explicitly bound collision risk. However, these probabilistic guarantees implicitly assume that upstream uncertainties from localization and perception are well-calibrated. In practice, estimators are often miscalibrated, inducing characteristic closed-loop failure modes: overconfidence leads to systematic safety violations, while underconfidence triggers overly conservative freezing or probability dilution. To address this critical gap, our primary contribution is a rigorous evaluation methodology applying proper scoring rules to assess the statistical validity of predicted collision risks during closed-loop execution. Concurrently, Dual-Uncertainty Chance-Constrained Tube MPPI (DUCCT-MPPI) is proposed as a real-time, risk-aware planning architecture. DUCCT-MPPI jointly integrates localization uncertainty via a one-tube Unscented Transform (UT) approximation and dynamic obstacle prediction uncertainty via Monte Carlo aggregation. Through extensive physics-based simulations, the framework demonstrates robust failure-mitigation, seamlessly transitioning to safe, conservative maneuvering without succumbing to functional deadlocks in highly cluttered environments. In highly cluttered environments, DUCCT-MPPI achieves superior robustness, outperforming established Monte Carlo MPPI baselines by nearly 28\% in navigation success rate, while simultaneously recording the lowest travel times and minimizing induced social forces. Ultimately, these findings establish that reliable probabilistic safety in autonomous navigation dictates not only expressive risk models but statistically valid uncertainty estimates throughout the entire autonomy stack.
- Abstract(参考訳): 衝突リスクを明確に拘束するために、動的環境におけるナビゲーションにMPPI(Chance-Constrained Model Predictive Path Integral)制御が採用されている。
しかしながら、これらの確率的保証は、局所化と知覚からの上流の不確かさが十分に校正されていることを暗黙的に仮定する。
過信は系統的な安全違反を引き起こすが、過信は過度に保守的な凍結または確率の希釈を引き起こす。
この重要なギャップに対処するため,我々は,閉ループ実行時の予測衝突リスクの統計的妥当性を評価するために,適切なスコアリングルールを適用した厳密な評価手法を開発した。
同時に、DUCCT-MPPI (Dual-Uncertainty Chance-Constrained Tube MPPI) が、リアルタイムのリスク対応計画アーキテクチャとして提案されている。
DUCCT-MPPIは,一管アンセント変換(UT)近似とモンテカルロ凝集による動的障害物予測の不確かさを併用する。
物理学に基づく広範なシミュレーションを通じて、このフレームワークは堅牢な障害軽減を実証し、高度に散らばった環境で機能的なデッドロックに分解することなく、シームレスに安全で保守的な操作に移行する。
高粗い環境では、DUCCT-MPPIは優れた堅牢性を実現し、確立されたモンテカルロMPPIベースラインの航法成功率を28倍近く上回り、同時に最低走行時間を記録し、誘導された社会力を最小化する。
これらの結果は、自律ナビゲーションにおける信頼性の高い確率論的安全性が、表現力のあるリスクモデルだけでなく、自律スタック全体を通して統計的に妥当な不確実性推定を規定していることを証明している。
関連論文リスト
- Trust, Geometry, and Rules: A Credibility-Aware Reinforcement Learning Framework for Safe USV Navigation under Uncertainty [32.34854002457735]
本稿では,信頼性を意識した学習,幾何的安全遮蔽,連続ルール認識の埋め込みを組み込んだフレームワークを提案する。
本研究は,直観的不整合に対するトレーニングの堅牢性の向上と衝突回避性の向上,およびベースラインに対するCOLREGのコンプライアンスについて述べる。
論文 参考訳(メタデータ) (2026-05-26T12:59:43Z) - Action-Conditioned Risk Gating for Safety-Critical Control under Partial Observability [79.08785366532287]
部分観測可能性下でのリスク感応制御のための軽量なリスクゲート強化学習近似を提案する。
安全クリティカルな部分観測可能な2つの領域 – 自動グルコース調節と安全制約ナビゲーション – でアプローチを評価した。
論文 参考訳(メタデータ) (2026-05-14T01:23:09Z) - Risk-Constrained Belief-Space Optimization for Safe Control under Latent Uncertainty [5.99447754429793]
多くの安全クリティカル制御システムは、センサーが決定時に直接解決できないという遅延不確実性の下で動作しなければならない。
標準的な手法は期待されたパフォーマンスを最適化し、稀だが深刻な結果に対する限定的な保護を提供する。
本稿では, 力学, コスト, 安全性の制約が, 信念分布として維持される潜在パラメータに依存する, 部分的に観察された力学系について考察する。
論文 参考訳(メタデータ) (2026-04-04T21:22:44Z) - Response-Aware Risk-Constrained Control Barrier Function With Application to Vehicles [0.0]
本稿では,車両の動的安全境界制御のための応答認識型リスク制約制御バリア関数に基づく統合制御フレームワークを提案する。
このフレームワークは、制御勾配の基準方向を提供するために、名目力学と直接車体応答を融合する。
また、従来の決定論的安全制約をバリア関数誘導体のテールリスクに関する確率論的制約に再構成する。
論文 参考訳(メタデータ) (2026-03-13T02:38:17Z) - Sim2Act: Robust Simulation-to-Decision Learning via Adversarial Calibration and Group-Relative Perturbation [54.29523408543184]
シミュレーションと意思決定の学習は、現実世界の展開を危険にさらすことなく、デジタル環境で安全なポリシートレーニングを可能にする。
既存のアプローチでは、平均的なシミュレーションの忠実さを改善するか、保守的な正規化を採用するかに重点を置いている。
提案するSim2Actは,シミュレータとポリシーのロバスト性の両方に対処するロバストなシミュレーション・トゥ・意思決定フレームワークである。
論文 参考訳(メタデータ) (2026-03-10T00:51:47Z) - Gaussian Mixture-Based Inverse Perception Contract for Uncertainty-Aware Robot Navigation [14.159772216001954]
逆知覚契約(IPC)は、信頼度の高い基底真理を含む集合に推定値をマッピングすることでそのような接続を提供する。
本稿では,ガウス混合に基づく逆知覚契約(GM-IPC)を導入する。
この不確実性の特徴は、下流の計画フレームワークでリアルタイム安全なナビゲーションに活用できることが示されている。
論文 参考訳(メタデータ) (2026-03-04T17:48:18Z) - Accelerated Online Risk-Averse Policy Evaluation in POMDPs with Theoretical Guarantees and Novel CVaR Bounds [9.269394037577177]
この研究は、部分的に観測可能な領域における条件付き値-アット・リスク評価を加速するための理論的枠組みを導入する。
単純化された信念-MDPから計算可能なCVaR値関数の上下境界を確立する。
我々は,確率的保証を伴う粒子信頼型MDPフレームワーク内で,これらの境界に対する推定器を開発する。
論文 参考訳(メタデータ) (2026-02-26T15:01:40Z) - Score Matching-based Pseudolikelihood Estimation of Neural Marked
Spatio-Temporal Point Process with Uncertainty Quantification [59.81904428056924]
我々は、不確実な定量化を伴うmarkPsを学習するためのスコアMAtching推定器であるSMASHを紹介する。
具体的には,スコアマッチングによるマークPsの擬似的類似度を推定することにより,正規化自由度を推定する。
提案手法の優れた性能は、事象予測と不確実性定量化の両方において広範な実験によって実証される。
論文 参考訳(メタデータ) (2023-10-25T02:37:51Z) - Safety Margins for Reinforcement Learning [53.10194953873209]
安全マージンを生成するためにプロキシ臨界度メトリクスをどのように活用するかを示す。
Atari 環境での APE-X と A3C からの学習方針に対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-07-25T16:49:54Z) - Probabilities Are Not Enough: Formal Controller Synthesis for Stochastic
Dynamical Models with Epistemic Uncertainty [68.00748155945047]
複雑な力学系のモデルにおける不確実性を捉えることは、安全なコントローラの設計に不可欠である。
いくつかのアプローチでは、安全と到達可能性に関する時間的仕様を満たすポリシーを形式的な抽象化を用いて合成する。
我々の貢献は、ノイズ、不確実なパラメータ、外乱を含む連続状態モデルに対する新しい抽象的制御法である。
論文 参考訳(メタデータ) (2022-10-12T07:57:03Z) - Pointwise Feasibility of Gaussian Process-based Safety-Critical Control
under Model Uncertainty [77.18483084440182]
制御バリア関数(CBF)と制御リアプノフ関数(CLF)は、制御システムの安全性と安定性をそれぞれ強化するための一般的なツールである。
本稿では, CBF と CLF を用いた安全クリティカルコントローラにおいて, モデル不確実性に対処するためのガウスプロセス(GP)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-13T23:08:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。