論文の概要: SocialNav: Training Human-Inspired Foundation Model for Socially-Aware Embodied Navigation
- arxiv url: http://arxiv.org/abs/2511.21135v1
- Date: Wed, 26 Nov 2025 07:36:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.011774
- Title: SocialNav: Training Human-Inspired Foundation Model for Socially-Aware Embodied Navigation
- Title(参考訳): SocialNav: 社会的に意識した身体的ナビゲーションのための人間にインスパイアされた基礎モデルをトレーニングする
- Authors: Ziyi Chen, Yingnan Guo, Zedong Chu, Minghua Luo, Yanfen Shen, Mingchao Sun, Junjun Hu, Shichao Xie, Kuan Yang, Pei Shi, Zhining Gu, Lu Liu, Honglin Han, Xiaolong Wu, Mu Xu, Yu Zhang,
- Abstract要約: 社会規範に準拠した身体的ナビゲーションは、依然としてオープンな研究課題である。
SocialNavは階層的な「ブレインアクション」アーキテクチャを備えた、社会的に認識されたナビゲーションの基盤モデルである。
SocialNavは、最先端の手法に比べて+38%の成功率と+46%の社会コンプライアンス率を達成した。
- 参考スコア(独自算出の注目度): 15.585324177543605
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied navigation that adheres to social norms remains an open research challenge. Our \textbf{SocialNav} is a foundational model for socially-aware navigation with a hierarchical "brain-action" architecture, capable of understanding high-level social norms and generating low-level, socially compliant trajectories. To enable such dual capabilities, we construct the SocNav Dataset, a large-scale collection of 7 million samples, comprising (1) a Cognitive Activation Dataset providing social reasoning signals such as chain-of-thought explanations and social traversability prediction, and (2) an Expert Trajectories Pyramid aggregating diverse navigation demonstrations from internet videos, simulated environments, and real-world robots. A multi-stage training pipeline is proposed to gradually inject and refine navigation intelligence: we first inject general navigation skills and social norms understanding into the model via imitation learning, and then refine such skills through a deliberately designed Socially-Aware Flow Exploration GRPO (SAFE-GRPO), the first flow-based reinforcement learning framework for embodied navigation that explicitly rewards socially compliant behaviors. SocialNav achieves +38% success rate and +46% social compliance rate compared to the state-of-the-art method, demonstrating strong gains in both navigation performance and social compliance. Our project page: https://amap-eai.github.io/SocialNav/
- Abstract(参考訳): 社会規範に準拠した身体的ナビゲーションは、依然としてオープンな研究課題である。
我々の『textbf{SocialNav}』は、階層的な「脳活動」アーキテクチャを持つ、社会的に意識したナビゲーションの基本モデルであり、高いレベルの社会的規範を理解し、低レベルの社会的に適合した軌道を生成することができる。
このような二重機能を実現するために,(1)チェーン・オブ・プリンティングやソーシャル・トラバーサビリティ・予測といった社会的推論信号を提供する認知活性化データセット,(2)インターネットビデオ,シミュレーション環境,実世界のロボットから多様なナビゲーションデモを集約するピラミッドを含む,700万件の大規模なサンプル集合であるSocNavデータセットを構築した。
多段階の訓練パイプラインは、ナビゲーションインテリジェンスを徐々に注入し、洗練するために提案されている。まず、模倣学習を通じてモデルに一般的なナビゲーションスキルと社会規範を注入し、次に、社会的に従順な行動を明確に報酬する最初のフローベース強化学習フレームワークである、社会的に意識的なフロー探索 GRPO (SAFE-GRPO) を通じて、これらのスキルを洗練する。
SocialNavは、最先端の手法と比較して+38%の成功率と+46%の社会コンプライアンス率を達成した。
プロジェクトページ:https://amap-eai.github.io/SocialNav/
関連論文リスト
- From Obstacles to Etiquette: Robot Social Navigation with VLM-Informed Path Selection [57.74400052368147]
本稿では,幾何学的計画と文脈的社会的推論を統合した社会ロボットナビゲーションフレームワークを提案する。
このシステムはまず障害物や人間の力学を抽出し、幾何学的に実現可能な候補経路を生成し、次に細調整された視覚言語モデル(VLM)を利用してこれらの経路を評価する。
4つのソーシャルナビゲーション環境における実験により, 生活空間違反の最小期間, 歩行者面の最小時間, 社会ゾーンの侵入がない場合に, ベストな総合的なパフォーマンスを達成できることが実証された。
論文 参考訳(メタデータ) (2026-02-09T18:46:12Z) - LISN: Language-Instructed Social Navigation with VLM-based Controller Modulating [47.62872797480247]
LISN-Benchは,言語指導型ソーシャルナビゲーションのシミュレーションに基づく最初のベンチマークである。
VLMエージェントがコストマップとコントローラパラメータを変調する高速な階層システムであるSocial-Nav-Modulatorを提案する。
本手法は,最も競争力のあるベースラインよりも63%以上高い91.3%の平均成功率を達成する。
論文 参考訳(メタデータ) (2025-12-10T18:54:30Z) - From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - Hyp2Nav: Hyperbolic Planning and Curiosity for Crowd Navigation [58.574464340559466]
我々は,群集ナビゲーションを実現するための双曲学習を提唱し,Hyp2Navを紹介した。
Hyp2Navは双曲幾何学の本質的な性質を活用し、ナビゲーションタスクにおける意思決定プロセスの階層的性質をよりよく符号化する。
本稿では, 効果的なソーシャルナビゲーション, 最高の成功率, 複数シミュレーション設定におけるリターンをもたらす, 双曲型ポリシーモデルと双曲型好奇性モジュールを提案する。
論文 参考訳(メタデータ) (2024-07-18T14:40:33Z) - Principles and Guidelines for Evaluating Social Robot Navigation
Algorithms [44.51586279645062]
社会的ロボットナビゲーションは、動的エージェントとそのロボット行動の適切性に対する認識が関係しているため、評価が難しい。
コントリビューションには、(a)安全性、快適性、妥当性、丁寧さ、社会的能力、エージェント理解、活動性、文脈に対する応答性に関する原則、(b)メトリクスの使用のためのガイドライン、シナリオ、ベンチマーク、データセット、社会ナビゲーションを評価するためのシミュレーター、(c)様々なシミュレーター、ロボット、データセットの結果の比較を容易にするソーシャルナビゲーションメトリクスフレームワークなどが含まれます。
論文 参考訳(メタデータ) (2023-06-29T07:31:43Z) - SocNavGym: A Reinforcement Learning Gym for Social Navigation [0.0]
SocNavGymは、ソーシャルナビゲーションのための高度なシミュレーション環境である。
さまざまなタイプのソーシャルナビゲーションシナリオを生成することができる。
また、さまざまな手作りとデータ駆動のソーシャル報酬信号を扱うように設定することもできる。
論文 参考訳(メタデータ) (2023-04-27T11:29:02Z) - Exploiting Socially-Aware Tasks for Embodied Social Navigation [17.48110264302196]
本稿では,ソーシャル・アウェア・タスクを活用して,強化学習ナビゲーションポリシーに注入するエンド・ツー・エンドアーキテクチャを提案する。
この目的のために、我々のタスクは衝突の即時および将来の危険という概念を利用する。
Gibson4+およびHabitat-Matterport3Dデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2022-12-01T18:52:46Z) - Gesture2Path: Imitation Learning for Gesture-aware Navigation [54.570943577423094]
Gesture2Pathは、画像に基づく模倣学習とモデル予測制御を組み合わせた新しいソーシャルナビゲーション手法である。
実際のロボットに本手法をデプロイし,4つのジェスチャーナビゲーションシナリオに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2022-09-19T23:05:36Z) - Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of
Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。
私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文 参考訳(メタデータ) (2022-03-28T19:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。