論文の概要: Towards Generalizable Safety in Crowd Navigation via Conformal Uncertainty Handling
- arxiv url: http://arxiv.org/abs/2508.05634v1
- Date: Thu, 07 Aug 2025 17:59:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.992429
- Title: Towards Generalizable Safety in Crowd Navigation via Conformal Uncertainty Handling
- Title(参考訳): コンフォーマル不確実性ハンドリングによる群集ナビゲーションにおける一般化可能な安全を目指して
- Authors: Jianpeng Yao, Xiaopan Zhang, Yu Xia, Zejin Wang, Amit K. Roy-Chowdhury, Jiachen Li,
- Abstract要約: そこで本研究では,ロボットが分散シフトに頑健な安全なナビゲーションポリシーを学習できることを提案する。
本手法は適応型共形推論により生成された予測不確実性推定を用いてエージェント観測を増強する。
我々は,本手法を実際のロボットに展開し,疎密な群集と密集した群集との相互作用において,ロボットが安全かつ堅牢な決定を行うことを示す。
- 参考スコア(独自算出の注目度): 26.554847852013737
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile robots navigating in crowds trained using reinforcement learning are known to suffer performance degradation when faced with out-of-distribution scenarios. We propose that by properly accounting for the uncertainties of pedestrians, a robot can learn safe navigation policies that are robust to distribution shifts. Our method augments agent observations with prediction uncertainty estimates generated by adaptive conformal inference, and it uses these estimates to guide the agent's behavior through constrained reinforcement learning. The system helps regulate the agent's actions and enables it to adapt to distribution shifts. In the in-distribution setting, our approach achieves a 96.93% success rate, which is over 8.80% higher than the previous state-of-the-art baselines with over 3.72 times fewer collisions and 2.43 times fewer intrusions into ground-truth human future trajectories. In three out-of-distribution scenarios, our method shows much stronger robustness when facing distribution shifts in velocity variations, policy changes, and transitions from individual to group dynamics. We deploy our method on a real robot, and experiments show that the robot makes safe and robust decisions when interacting with both sparse and dense crowds. Our code and videos are available on https://gen-safe-nav.github.io/.
- Abstract(参考訳): 強化学習を用いて訓練された群集をナビゲートする移動ロボットは、アウト・オブ・ディストリビューションシナリオに直面すると性能劣化に悩むことが知られている。
歩行者の不確かさを適切に考慮することにより,ロボットは分布変化に頑健な安全なナビゲーションポリシーを学習できる。
本手法は適応型等角推論による予測不確かさ推定を用いてエージェントの観察を増強し,これらの推定値を用いてエージェントの動作を制約付き強化学習を通して導く。
このシステムはエージェントの動作の調整に役立ち、分散シフトへの適応を可能にする。
本手法は,従来の最先端ベースラインよりも8.80%以上,3.72倍以上の衝突,2.43倍の人体将来の軌道への侵入で96.93%の成功率を達成した。
3つのアウト・オブ・ディストリビューション・シナリオにおいて, 速度変動, 政策変化, 個人からグループへの遷移の分布変化に直面する場合, より強力なロバスト性を示す。
我々は,本手法を実際のロボットに展開し,疎密な群集と密集した群集との相互作用において,ロボットが安全かつ堅牢な決定を行うことを示す。
私たちのコードとビデオはhttps://gen-safe-nav.github.io/で公開されています。
関連論文リスト
- Action Flow Matching for Continual Robot Learning [57.698553219660376]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。
本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。
ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文 参考訳(メタデータ) (2025-04-25T16:26:15Z) - Disentangling Uncertainty for Safe Social Navigation using Deep Reinforcement Learning [0.4218593777811082]
本研究は, 政策分布不確実性推定のためのDRLナビゲーションフレームワークに, アレタリック, エピステミック, 予測不確実性推定を統合する新しいアプローチを導入する。
本研究では,不確実な意思決定状況において,ロボットの社会的行動から保守的衝突回避への転換を提案する。
その結果, PPOにおけるODVおよびDropoutによるトレーニング性能が向上し, トレーニングシナリオが一般化に影響を及ぼすことが明らかとなった。
論文 参考訳(メタデータ) (2024-09-16T18:49:38Z) - SoNIC: Safe Social Navigation with Adaptive Conformal Inference and Constrained Reinforcement Learning [26.554847852013737]
SoNICは適応型共形推論と制約付き強化学習を統合する最初のアルゴリズムである。
本手法は,従来の最先端RL法よりも11.67%高い96.93%の成功率を達成する。
実験により,疎密な群集と密集した群集の両方と相互作用して,堅牢で社会的に礼儀正しく意思決定できることを示した。
論文 参考訳(メタデータ) (2024-07-24T17:57:21Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Resilient Legged Local Navigation: Learning to Traverse with Compromised
Perception End-to-End [16.748853375988013]
我々は認識障害を目に見えない障害と落とし穴としてモデル化する。
我々は、強化学習に基づくローカルナビゲーションポリシーを訓練し、足のついたロボットを案内する。
シミュレーションおよび実四足歩行ロボットANYmalをリアルタイムに動作させることにより,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-10-05T15:01:31Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Enhanced method for reinforcement learning based dynamic obstacle
avoidance by assessment of collision risk [0.0]
本稿では,障害物回避作業の難易度を制御できる一般的な訓練環境を提案する。
トレーニングをタスクの難しさにシフトすることで,最終的なパフォーマンスを大幅に向上できることがわかった。
論文 参考訳(メタデータ) (2022-12-08T07:46:42Z) - Adaptive Risk Tendency: Nano Drone Navigation in Cluttered Environments
with Distributional Reinforcement Learning [17.940958199767234]
適応型リスク傾向ポリシーを学習するための分散強化学習フレームワークを提案する。
本アルゴリズムは,シミュレーションと実世界の実験の両方において,ハエのリスク感度を調整可能であることを示す。
論文 参考訳(メタデータ) (2022-03-28T13:39:58Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - XAI-N: Sensor-based Robot Navigation using Expert Policies and Decision
Trees [55.9643422180256]
本稿では,ロボットの密集した動的環境における衝突のない軌道を計算するためのセンサベース学習ナビゲーションアルゴリズムを提案する。
我々のアプローチは、sim2realパラダイムを用いて訓練された深層強化学習に基づくエキスパートポリシーを使用する。
シミュレーション環境でのアルゴリズムの利点を強調し、移動中の歩行者の間でClearpath Jackalロボットをナビゲートする。
論文 参考訳(メタデータ) (2021-04-22T01:33:10Z) - Learning to Communicate and Correct Pose Errors [75.03747122616605]
本稿では、V2VNetで提案された設定について検討し、近くにある自動運転車が共同で物体検出と動き予測を協調的に行う方法を提案する。
本稿では,コミュニケーションを学習し,潜在的な誤りを推定し,それらの誤りについてコンセンサスを得るための新しいニューラルネットワーク推論フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-10T18:19:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。