論文の概要: NavThinker: Action-Conditioned World Models for Coupled Prediction and Planning in Social Navigation
- arxiv url: http://arxiv.org/abs/2603.15359v2
- Date: Wed, 18 Mar 2026 15:08:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.873101
- Title: NavThinker: Action-Conditioned World Models for Coupled Prediction and Planning in Social Navigation
- Title(参考訳): NavThinker:ソーシャルナビゲーションにおける協調予測と計画のための行動規定世界モデル
- Authors: Tianshuai Hu, Zeying Gong, Lingdong Kong, XiaoDong Mei, Yiyi Ding, Qi Zeng, Ao Liang, Rong Li, Yangyi Zhong, Junwei Liang,
- Abstract要約: 社会的なナビゲーションには、ロボットがダイナミックな人間の環境で安全に行動する必要がある。
我々は,行動条件付き世界モデルと政治強化学習を結合した将来的なフレームワークであるNavThinkerを提案する。
シングルロボットとマルチロボットのSocial-HM3Dの実験では、最先端のナビゲーションが成功し、Social-MP3Dにゼロショットで転送され、Unitree Go2上で現実世界にデプロイされる。
- 参考スコア(独自算出の注目度): 20.161788094382526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social navigation requires robots to act safely in dynamic human environments. Effective behavior demands thinking ahead: reasoning about how the scene and pedestrians evolve under different robot actions rather than reacting to current observations alone. This creates a coupled prediction-planning challenge, where robot actions and human motion mutually influence each other. To address this challenge, we propose NavThinker, a future-aware framework that couples an action-conditioned world model with on-policy reinforcement learning. The world model operates in the Depth Anything V2 patch feature space and performs autoregressive prediction of future scene geometry and human motion; multi-head decoders then produce future depth maps and human trajectories, yielding a future-aware state aligned with traversability and interaction risk. Crucially, we train the policy with DD-PPO while injecting world-model think-ahead signals via: (i) action-conditioned future features fused into the current observation embedding and (ii) social reward shaping from predicted human trajectories. Experiments on single- and multi-robot Social-HM3D show state-of-the-art navigation success, with zero-shot transfer to Social-MP3D and real-world deployment on a Unitree Go2, validating generalization and practical applicability. Webpage: https://hutslib.github.io/NavThinker.
- Abstract(参考訳): 社会的なナビゲーションには、ロボットがダイナミックな人間の環境で安全に行動する必要がある。
効果的な行動とは、現在の観察のみに反応するのではなく、異なるロボット行動の下で、シーンと歩行者がどのように進化するかを推論することである。
これにより、ロボットの行動と人間の動きが相互に影響を及ぼす予測計画の課題が生まれます。
この課題に対処するために,行動条件付き世界モデルと政治強化学習を結合した将来的なフレームワークであるNavThinkerを提案する。
ワールドモデルはDepth Anything V2 パッチの特徴空間で動作し、将来のシーンの幾何学と人間の動きの自己回帰予測を行う。
重要なことは、DD-PPOを用いて、世界モデルシンクアヘッド信号を注入しながらポリシーを訓練する。
一 現在の観察埋没物に融合した行動条件付き将来の特徴
二 予測された人間の軌道から社会報酬を形成すること。
シングルロボットとマルチロボットのSocial-HM3Dの実験では、Social-MP3Dへのゼロショット転送、Unitree Go2への実環境展開、一般化と実用性を検証するなど、最先端のナビゲーションの成功が示されている。
Webページ: https://hutslib.github.io/NavThinker.com
関連論文リスト
- Social-Pose: Enhancing Trajectory Prediction with Human Body Pose [70.59399670794171]
本研究では,人体ポーズを用いた人体軌道予測の利点について検討した。
我々は,シーン内のすべての人間のポーズとその社会的関係を効果的にキャプチャするアテンションベースのポーズエンコーダであるSocial-poseを提案する。
論文 参考訳(メタデータ) (2025-07-30T14:58:48Z) - Following the Human Thread in Social Navigation [10.384957135051119]
ソーシャルナビゲーションはロボットの人間の動きへのリアルタイム適応に依存している。
人間軌道は社会航法において重要な手がかりとして現れるが、ロボットの自我中心的な視点から部分的に観察可能である。
本稿では,ロボットの行動履歴に基づく社会ダイナミクス適応モデルを提案し,その社会的ダイナミクスを推算する。
論文 参考訳(メタデータ) (2024-04-17T12:39:48Z) - Robot Interaction Behavior Generation based on Social Motion Forecasting for Human-Robot Interaction [9.806227900768926]
本稿では,共有ロボット表現空間における社会的動き予測のモデル化を提案する。
ECHOは上記の共有空間で活動し、社会的シナリオで遭遇したエージェントの将来の動きを予測する。
我々は,多対人動作予測タスクにおけるモデルの評価を行い,最先端の性能を大きなマージンで獲得する。
論文 参考訳(メタデータ) (2024-02-07T11:37:14Z) - Social-Transmotion: Promptable Human Trajectory Prediction [65.80068316170613]
Social-Transmotionは、多種多様な視覚的手がかりを利用して人間の行動を予測する、汎用トランスフォーマーベースのモデルである。
提案手法は,JTA,JRDB,歩行者,道路交通のサイクリスト,ETH-UCYなど,複数のデータセットで検証されている。
論文 参考訳(メタデータ) (2023-12-26T18:56:49Z) - Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。
我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文 参考訳(メタデータ) (2023-08-30T17:59:05Z) - Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of
Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。
私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文 参考訳(メタデータ) (2022-03-28T19:09:11Z) - Intention Aware Robot Crowd Navigation with Attention-Based Interaction
Graph [3.8461692052415137]
本研究では,高密度で対話的な群集における安全かつ意図に配慮したロボットナビゲーションの課題について検討する。
本稿では,エージェント間の異種相互作用を捕捉するアテンション機構を備えた新しいグラフニューラルネットワークを提案する。
提案手法は,群集ナビゲーションのシナリオにおいて,優れたナビゲーション性能と非侵襲性をロボットが実現できることを実証する。
論文 参考訳(メタデータ) (2022-03-03T16:26:36Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。