論文の概要: From Obstacles to Etiquette: Robot Social Navigation with VLM-Informed Path Selection
- arxiv url: http://arxiv.org/abs/2602.09002v1
- Date: Mon, 09 Feb 2026 18:46:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.43214
- Title: From Obstacles to Etiquette: Robot Social Navigation with VLM-Informed Path Selection
- Title(参考訳): 障害物からエティケットへ:VLMによる経路選択によるロボットソーシャルナビゲーション
- Authors: Zilin Fang, Anxing Xiao, David Hsu, Gim Hee Lee,
- Abstract要約: 本稿では,幾何学的計画と文脈的社会的推論を統合した社会ロボットナビゲーションフレームワークを提案する。
このシステムはまず障害物や人間の力学を抽出し、幾何学的に実現可能な候補経路を生成し、次に細調整された視覚言語モデル(VLM)を利用してこれらの経路を評価する。
4つのソーシャルナビゲーション環境における実験により, 生活空間違反の最小期間, 歩行者面の最小時間, 社会ゾーンの侵入がない場合に, ベストな総合的なパフォーマンスを達成できることが実証された。
- 参考スコア(独自算出の注目度): 57.74400052368147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating socially in human environments requires more than satisfying geometric constraints, as collision-free paths may still interfere with ongoing activities or conflict with social norms. Addressing this challenge calls for analyzing interactions between agents and incorporating common-sense reasoning into planning. This paper presents a social robot navigation framework that integrates geometric planning with contextual social reasoning. The system first extracts obstacles and human dynamics to generate geometrically feasible candidate paths, then leverages a fine-tuned vision-language model (VLM) to evaluate these paths, informed by contextually grounded social expectations, selecting a socially optimized path for the controller. This task-specific VLM distills social reasoning from large foundation models into a smaller and efficient model, allowing the framework to perform real-time adaptation in diverse human-robot interaction contexts. Experiments in four social navigation contexts demonstrate that our method achieves the best overall performance with the lowest personal space violation duration, the minimal pedestrian-facing time, and no social zone intrusions. Project page: https://path-etiquette.github.io
- Abstract(参考訳): 人間の環境で社会的にナビゲートするには、衝突のない経路が今も継続する活動や社会規範との衝突に干渉する可能性があるため、幾何学的な制約を満たす以上のことが必要である。
この課題に対処するには、エージェント間のインタラクションを分析し、計画に常識的推論を取り入れることが必要だ。
本稿では,幾何学的計画と文脈的社会的推論を統合した社会ロボットナビゲーションフレームワークを提案する。
このシステムは、まず障害物や人間のダイナミクスを抽出して幾何学的に実現可能な候補経路を生成し、次に微調整された視覚言語モデル(VLM)を用いてこれらの経路を評価し、文脈的に基礎付けられた社会的期待に基づいて、制御器の社会的に最適化された経路を選択する。
このタスク固有のVLMは、大きな基礎モデルからより小さく効率的なモデルに社会的推論を蒸留し、多様な人間とロボットの相互作用コンテキストにおいてリアルタイムに適応することを可能にする。
4つのソーシャルナビゲーション環境における実験により, 生活空間違反の最小期間, 歩行者面の最小時間, 社会ゾーンの侵入がない場合に, ベストな総合的なパフォーマンスを達成できることが実証された。
プロジェクトページ: https://path-etiquette.github.io
関連論文リスト
- GSON: A Group-based Social Navigation Framework with Large Multimodal Model [9.94576166903495]
本稿では,新しいグループベースのソーシャルナビゲーションフレームワークであるGSONを紹介する。
GSONは視覚的プロンプトを使用して、歩行者間の社会的関係のゼロショット抽出を可能にする。
我々は、大規模な実世界の移動ロボットナビゲーション実験を通じてGSONを検証する。
論文 参考訳(メタデータ) (2024-09-26T17:27:15Z) - Socially Integrated Navigation: A Social Acting Robot with Deep Reinforcement Learning [0.7864304771129751]
移動ロボットは様々な混み合った状況で大規模に使われており、私たちの社会の一部になっている。
個人を考慮した移動ロボットの社会的に許容されるナビゲーション行動は、スケーラブルなアプリケーションと人間の受容にとって必須の要件である。
本稿では,ロボットの社会行動が適応的であり,人間との相互作用から生じる,社会統合型ナビゲーション手法を提案する。
論文 参考訳(メタデータ) (2024-03-14T18:25:40Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - Principles and Guidelines for Evaluating Social Robot Navigation
Algorithms [44.51586279645062]
社会的ロボットナビゲーションは、動的エージェントとそのロボット行動の適切性に対する認識が関係しているため、評価が難しい。
コントリビューションには、(a)安全性、快適性、妥当性、丁寧さ、社会的能力、エージェント理解、活動性、文脈に対する応答性に関する原則、(b)メトリクスの使用のためのガイドライン、シナリオ、ベンチマーク、データセット、社会ナビゲーションを評価するためのシミュレーター、(c)様々なシミュレーター、ロボット、データセットの結果の比較を容易にするソーシャルナビゲーションメトリクスフレームワークなどが含まれます。
論文 参考訳(メタデータ) (2023-06-29T07:31:43Z) - Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of
Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。
私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文 参考訳(メタデータ) (2022-03-28T19:09:11Z) - SSAGCN: Social Soft Attention Graph Convolution Network for Pedestrian
Trajectory Prediction [59.064925464991056]
ソーシャルソフトアテンショングラフ畳み込みネットワーク(SSAGCN)という新しい予測モデルを提案する。
SSAGCNは、歩行者間の社会的相互作用と歩行者と環境間のシーンインタラクションを同時に扱うことを目的としている。
公開データセットの実験は、SAGCNの有効性を証明し、最先端の結果を得た。
論文 参考訳(メタデータ) (2021-12-05T01:49:18Z) - PHASE: PHysically-grounded Abstract Social Events for Machine Social
Perception [50.551003004553806]
私たちは、物理的に根拠のある抽象的なソーシャルイベント、フェーズのデータセットを作成します。
フェーズは人間の実験によって検証され、人間は社会出来事において豊かな相互作用を知覚する。
ベースラインモデルとして,最新のフィードフォワードニューラルネットワークよりも優れたベイズ逆計画手法SIMPLEを導入する。
論文 参考訳(メタデータ) (2021-03-02T18:44:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。