論文の概要: RCSP: Risk-Sensitive Conjectural Scenario Planning for Safe Dynamic Robot Navigation
- arxiv url: http://arxiv.org/abs/2605.26348v1
- Date: Mon, 25 May 2026 21:47:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.477361
- Title: RCSP: Risk-Sensitive Conjectural Scenario Planning for Safe Dynamic Robot Navigation
- Title(参考訳): RCSP:安全ロボットナビゲーションのためのリスク感性客観シナリオ計画
- Authors: Zhengye Han, Quanyan Zhu,
- Abstract要約: リスク感性行動シナリオ計画(RCSP)は、予測可能な短水平障害物の将来に対する候補命令を評価する計画層である。
制御された MuJoCo ボトルネックタスクでは、RCSP プランナーは衝突することなく目標を達成することができ、より高い二次安全性とパス品質の点推定が得られる。
- 参考スコア(独自算出の注目度): 16.960126375377133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile robots can fail before they collide: a velocity that is safe now may commit the robot to a passage that moving obstacles will soon close. We study this predictive near-miss commitment problem and propose Risk-Sensitive Conjectural Scenario Planning (RCSP), a planning layer that evaluates candidate commands against plausible short-horizon obstacle futures. RCSP maintains a lightweight belief over local motion conjectures, samples future interactions, penalizes high-risk tails, and executes through a local safety check. In controlled MuJoCo bottleneck tasks, the RCSP planner reaches the goal without collisions and yields higher secondary safety and path-quality point estimates than a non-adaptive predictor, with additional latency. In ROS2/Gazebo, adding the local safety layer to a standard Nav2 stack reduces dynamic near-miss failures. On official DynaBARN/Jackal transfer, tuned DWA and TEB remain stronger on strict benchmark success, revealing the boundary of the approach. These simulation results position RCSP as a predictive-risk module that complements existing navigation stacks in dynamic bottleneck regimes.
- Abstract(参考訳): 移動ロボットは衝突する前に失敗する可能性がある。現在安全である速度は、移動中の障害物がすぐに閉じる通路にロボットをコミットする可能性がある。
本研究では, この予測的ニアミスコミットメント問題について検討し, 提案するリスク・センシティブ・コンジェクタ・シナリオ・プランニング(RCSP, Risk-Sensitive Conjectural Scenario Planning)を提案する。
RCSPは、局所運動予想に対する軽量な信念を維持し、将来の相互作用をサンプリングし、リスクの高い尾を罰し、局所安全チェックを通じて実行する。
制御された MuJoCo ボトルネックタスクでは、RCSP プランナーは衝突することなく目標に達する。
ROS2/Gazeboでは、標準のNav2スタックにローカルセーフティ層を追加することで、動的ニアミス障害が低減される。
公式のDynaBARN/Jackal転送では、厳密なベンチマークの成功により、調整されたDWAとTEBが引き続き強くなり、アプローチの境界が明らかになった。
これらのシミュレーションの結果、RCSPは動的ボトルネック状態における既存のナビゲーションスタックを補完する予測リスクモジュールとして位置づけられる。
関連論文リスト
- Action-Conditioned Risk Gating for Safety-Critical Control under Partial Observability [79.08785366532287]
部分観測可能性下でのリスク感応制御のための軽量なリスクゲート強化学習近似を提案する。
安全クリティカルな部分観測可能な2つの領域 – 自動グルコース調節と安全制約ナビゲーション – でアプローチを評価した。
論文 参考訳(メタデータ) (2026-05-14T01:23:09Z) - RAD-2: Scaling Reinforcement Learning in a Generator-Discriminator Framework [49.531001563853984]
RAD-2はクローズドループ計画のための統一されたジェネレータ・ディスクリミネーターフレームワークである。
様々な軌道候補を生成する一方、RL最適化判別器は、これらの候補を長期的な運転品質に応じて再現する。
強い拡散ベースのプランナーに比べて衝突速度を56%削減する。
論文 参考訳(メタデータ) (2026-04-16T17:59:44Z) - VORL-EXPLORE: A Hybrid Learning Planning Approach to Multi-Robot Exploration in Dynamic Environments [19.811711277536187]
マルチロボット探索は通常、フロンティア割り当てをローカルナビゲーションから切り離す。
VORL-EXPLOREは,この制約に対処するハイブリッド学習・計画フレームワークである。
また、グローバルA*ガイダンスとリアクティブ強化学習ポリシーとの間のリスク対応適応的仲裁機構も推進している。
論文 参考訳(メタデータ) (2026-03-09T05:20:33Z) - RA-Nav: A Risk-Aware Navigation System Based on Semantic Segmentation for Aerial Robots in Unpredictable Environments [7.128475765820446]
既存の空飛ぶロボットナビゲーションシステムは、静的な障害物が突然動くと適応しない。
セマンティックセグメンテーションに基づくリスク対応ナビゲーションフレームワークであるRA-Navを提案する。
RA-Navは、突然の障害状態遷移シナリオにおいて、ベースラインよりも高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-19T16:26:43Z) - Risk-Aware Obstacle Avoidance Algorithm for Real-Time Applications [0.6299766708197881]
本研究は,車両経路に沿った障害物の確率論的モデリングと,自律表面容器のスムーズな軌道最適化を統合したハイブリッド型リスク対応ナビゲーションアーキテクチャを提案する。
提案手法は、運転安全性と自律性の向上を示し、不確実かつダイナミックな環境下でのリスク対応型自動運転車のミッションのための有望なソリューションとして確立する。
論文 参考訳(メタデータ) (2026-02-09T21:15:33Z) - UEREBot: Learning Safe Quadrupedal Locomotion under Unstructured Environments and High-Speed Dynamic Obstacles [16.149422197272937]
UEREBotは階層的なフレームワークで、スロープランニングと即時回帰回避を分離する。
我々はIsaac LabのシミュレーションでUEREBotを評価し,それを車載認識機能を備えたUnitree Go2上にデプロイした。
論文 参考訳(メタデータ) (2026-02-07T05:09:48Z) - Deep Reinforcement Learning with anticipatory reward in LSTM for Collision Avoidance of Mobile Robots [0.0]
本稿では,エージェント位置の短期予測に基づく衝突リスク予測手法を提案する。
過去の軌跡に基づいて訓練されたLong Short-Term Memory(LSTM)モデルを用いて,各ロボットの次の位置を推定する。
この予測により,Deep Q-Learning Network (DQN) エージェントの報酬を動的に調節することで,予測される衝突リスクを定義することができる。
論文 参考訳(メタデータ) (2025-08-11T12:55:51Z) - NOVA: Navigation via Object-Centric Visual Autonomy for High-Speed Target Tracking in Unstructured GPS-Denied Environments [56.35569661650558]
我々はNOVAというオブジェクト中心のフレームワークを導入し、ロバストな目標追跡と衝突認識ナビゲーションを可能にした。
グローバルマップを構築するのではなく、NOVAはターゲットの参照フレーム内での知覚、推定、制御を定式化する。
我々は,都市迷路や森林の小道,間欠的なGPS損失を伴う建物内の繰り返し遷移など,現実の挑戦的なシナリオにまたがってNOVAを検証する。
論文 参考訳(メタデータ) (2025-06-23T14:28:30Z) - SafePath: Conformal Prediction for Safe LLM-Based Autonomous Navigation [67.22657932549723]
SafePathは,LLM(Large Language Models)を公式な安全保証とともに拡張するフレームワークである。
第1段階では,多様な候補経路を生成するLCMを用いて,エージェントの挙動と環境条件に基づく軌道探索を行う。
第2段階では、SafePathはリスクの高いトラジェクトリをフィルタリングし、少なくとも1つのセーフオプションがユーザ定義の確率に含まれていることを保証します。
最終段階では,不確実性が低い場合や不確実性が高い場合,人間に制御を委譲する場合の衝突リスクが最も低い経路を選択する。
論文 参考訳(メタデータ) (2025-05-14T14:28:24Z) - Cautious Adaptation For Reinforcement Learning in Safety-Critical
Settings [129.80279257258098]
都市運転のような現実の安全クリティカルな目標設定における強化学習(RL)は危険である。
非安全クリティカルな「ソース」環境でエージェントが最初に訓練する「安全クリティカル適応」タスクセットを提案する。
多様な環境における事前経験がリスクを見積もるためにエージェントに装備するという直感に基づくソリューションアプローチであるCARLを提案する。
論文 参考訳(メタデータ) (2020-08-15T01:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。