論文の概要: SCRAMPPI: Efficient Contingency Planning for Mobile Robot Navigation via Hamilton-Jacobi Reachability
- arxiv url: http://arxiv.org/abs/2603.26995v1
- Date: Fri, 27 Mar 2026 21:09:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.725742
- Title: SCRAMPPI: Efficient Contingency Planning for Mobile Robot Navigation via Hamilton-Jacobi Reachability
- Title(参考訳): SCRAMPPI:ハミルトン・ヤコビの到達性を利用した移動ロボットナビゲーションのための効率的な並行性計画
- Authors: Raj Harshit Srirangam, Leonard Jung, Rohith Poola, Michael Everett,
- Abstract要約: 本稿では,安全制約による名目コストに対する軌道最適化問題を定式化する。
名目上の計画に沿う任意の地点から、指定された安全セットへの実現可能な軌道が存在する必要がある。
本研究は,移動ロボット上で,名目・緊急プランをリアルタイムで生成するアルゴリズムを実演し,シミュレーションおよびハードウェア実験を行った。
- 参考スコア(独自算出の注目度): 2.6424021470496672
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous robots commonly aim to complete a nominal behavior while minimizing a cost; this leaves them vulnerable to failure or unplanned scenarios, where a backup or contingency plan to a safe set is needed to avoid a total mission failure. This is formalized as a trajectory optimization problem over the nominal cost with a safety constraint: from any point along the nominal plan, a feasible trajectory to a designated safe set must exist. Previous methods either relax this hard constraint, or use an expensive sampling-based strategy to optimize for this constraint. Instead, we formalize this requirement as a reach-avoid problem and leverage Hamilton-Jacobi (HJ) reachability analysis to certify contingency feasibility. By computing the value function of our safe-set's backward reachable set online as the environment is revealed and integrating it with a sampling based planner (MPPI) via resampling based rollouts, we guarantee satisfaction of the hard constraint while greatly increasing sampling efficiency. Finally, we present simulated and hardware experiments demonstrating our algorithm generating nominal and contingency plans in real time on a mobile robot in an adversarial evasion task.
- Abstract(参考訳): 自律ロボットは通常、コストを最小化しながら、名目上の振る舞いを完了することを目的としています。これは、完全なミッション失敗を避けるために、安全なセットへのバックアップまたは緊急計画が必要な、障害や計画外のシナリオに対して脆弱なままにします。
これは、名目コストに対する軌道最適化問題として、安全制約で定式化され、名目計画に沿った任意の点から、指定された安全集合への実現可能な軌道が存在する必要がある。
以前の方法は、この制約を緩和するか、高価なサンプリングベースの戦略を使ってこの制約を最適化する。
代わりに、この要件をリーチエイド問題として定式化し、ハミルトン・ヤコビ(HJ)リーチビリティ解析を活用して、一致可能性の証明を行う。
環境が明らかになれば,安全セットの後方到達可能なセットの値関数をオンラインで計算し,再サンプリングベースロールアウトによるサンプリングベースプランナー(MPPI)と統合することにより,ハード制約の満足度を保証し,サンプリング効率を大幅に向上する。
最後に,我々のアルゴリズムが対向回避タスクにおいて,移動ロボット上で,名目計画と共起計画をリアルタイムで生成することを示すシミュレーションおよびハードウェア実験を示す。
関連論文リスト
- Contingency-Aware Planning via Certified Neural Hamilton-Jacobi Reachability [0.0]
Hamilton-Jacobi (HJ) 到達性は力学系に対して正式な安全保証を提供する。
本稿では,学習型リーチビリティとサンプリング型プランニングを統合した同時対応マルチゴールナビゲーションフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-17T18:04:20Z) - Soft Actor-Critic-based Control Barrier Adaptation for Robust Autonomous Navigation in Unknown Environments [4.788163807490197]
制御バリア関数(CBF)の制約パラメータを実行時に適用するためのソフトアクタ・クリティカル(SAC)ベースのポリシーを提案する。
我々は,本フレームワークがCBF制約を効果的に適用し,ロボットが安全性を損なうことなく最終目標に達することを実証した。
論文 参考訳(メタデータ) (2025-03-11T14:33:55Z) - ConstrainedZero: Chance-Constrained POMDP Planning using Learned Probabilistic Failure Surrogates and Adaptive Safety Constraints [34.9739641898452]
本研究では、最適値とポリシーのニューラルネットワーク近似を学習することにより、信念空間におけるCC-POMDPを解くConstrainedZeroポリシーアルゴリズムを導入する。
その結果, 目標から安全制約を分離することで, 報酬とコストのバランスを最適化することなく, 目標となる安全レベルを達成できることが示唆された。
論文 参考訳(メタデータ) (2024-05-01T17:17:22Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Meta-Learning Priors for Safe Bayesian Optimization [72.8349503901712]
メタ学習アルゴリズムであるF-PACOHを構築し,データ不足の設定において確実な定量化を実現する。
コアコントリビューションとして、安全に適合した事前をデータ駆動で選択するための新しいフレームワークを開発する。
ベンチマーク関数と高精度動作系において,我々のメタ学習先行が安全なBOアプローチの収束を加速することを示す。
論文 参考訳(メタデータ) (2022-10-03T08:38:38Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - Generating Useful Accident-Prone Driving Scenarios via a Learned Traffic
Prior [135.78858513845233]
STRIVEは、特定のプランナーが衝突のような望ましくない振る舞いを発生させるような、困難なシナリオを自動的に生成する手法である。
シナリオの妥当性を維持するために、キーとなるアイデアは、グラフベースの条件付きVAEという形で、学習した交通運動モデルを活用することである。
その後の最適化は、シナリオの"解決"を見つけるために使用され、与えられたプランナーを改善するのに有効である。
論文 参考訳(メタデータ) (2021-12-09T18:03:27Z) - SHARP: Shielding-Aware Robust Planning for Safe and Efficient
Human-Robot Interaction [5.804727815849655]
シールド」制御スキームは、安全クリティカルなイベントが差し迫った場合に、ロボットの名目上の計画と安全フォールバック戦略をオーバーライドする。
本研究では,ロボットが将来の遮蔽イベントを明示的に考慮し,効率的に計画できる新しい遮蔽型計画手法を提案する。
論文 参考訳(メタデータ) (2021-10-02T17:01:59Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。