論文の概要: Find a Way Forward: a Language-Guided Semantic Map Navigator
- arxiv url: http://arxiv.org/abs/2203.03183v1
- Date: Mon, 7 Mar 2022 07:40:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 16:18:49.818550
- Title: Find a Way Forward: a Language-Guided Semantic Map Navigator
- Title(参考訳): 将来への道を見つける - 言語に指示されたセマンティックマップナビゲータ
- Authors: Zehao Wang, Mingxiao Li, Minye Wu, Marie-Francine Moens, Tinne
Tuytelaars
- Abstract要約: 本稿では,新たな視点で言語誘導ナビゲーションの問題に対処する。
ロボットが自然言語の指示を実行し、地図観測に基づいて目標位置へ移動できるようにする。
提案手法は特に長距離ナビゲーションの場合において顕著な性能向上をもたらす。
- 参考スコア(独自算出の注目度): 53.69229615952205
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper attacks the problem of language-guided navigation in a new
perspective by using novel semantic navigation maps, which enables robots to
carry out natural language instructions and move to a target position based on
the map observations. We break down this problem into parts and introduce three
different modules to solve the corresponding subproblems. Our approach
leverages map information to provide Deterministic Path Candidate Proposals to
reduce the solution space. Different from traditional methods that predict
robots' movements toward the target step-by-step, we design an attention-based
Language Driven Discriminator to evaluate path candidates and determine the
best path as the final result. To represent the map observations along a path
for a better modality alignment, a novel Path Feature Encoding scheme tailored
for semantic navigation maps is proposed. Unlike traditional methods that tend
to produce cumulative errors or be stuck in local decisions, our method which
plans paths based on global information can greatly alleviate these problems.
The proposed approach has noticeable performance gains, especially in
long-distance navigation cases. Also, its training efficiency is significantly
higher than of other methods.
- Abstract(参考訳): 本稿では,ロボットが自然言語の指示を実行し,地図観測に基づいて目標位置へ移動できる新しい意味的ナビゲーションマップを用いて,新たな視点で言語誘導ナビゲーションの課題に対処する。
この問題を部分分解し、対応する部分問題を解くために3つの異なるモジュールを導入する。
提案手法は地図情報を利用して決定論的経路候補の提案を行い,解空間を縮小する。
ロボットの動きを段階的に予測する従来の手法と異なり、注意に基づく言語駆動識別器を設計し、経路候補を評価し、最終結果として最適経路を決定する。
モダリティアライメント改善のための経路に沿った地図観察を表現するために,セマンティックナビゲーションマップ用に調整された新しい経路特徴符号化方式を提案する。
累積誤差を発生させる従来の手法と異なり,グローバル情報に基づく経路計画手法は,これらの問題を著しく緩和することができる。
提案手法は特に長距離ナビゲーションの場合において顕著な性能向上をもたらす。
また、その訓練効率は他の方法に比べて著しく高い。
関連論文リスト
- PRET: Planning with Directed Fidelity Trajectory for Vision and Language Navigation [30.710806048991923]
視覚と言語ナビゲーションは、エージェントが自然言語の指示に従ってナビゲートする必要があるタスクである。
近年の手法では、各ステップで構築されたトポロジーマップのサブゴールを予測し、長期的な行動計画を可能にする。
本稿では,指示と指向性軌道のアライメントを考慮し,ナビゲーション計画を容易にする方法を提案する。
論文 参考訳(メタデータ) (2024-07-16T08:22:18Z) - Interactive Semantic Map Representation for Skill-based Visual Object
Navigation [43.71312386938849]
本稿では,室内環境との相互作用にともなうシーンセマンティックマップの表現について紹介する。
我々はこの表現をSkillTronと呼ばれる本格的なナビゲーション手法に実装した。
提案手法により,ロボット探索の中間目標とオブジェクトナビゲーションの最終目標の両方を形成できる。
論文 参考訳(メタデータ) (2023-11-07T16:30:12Z) - Object Goal Navigation with Recursive Implicit Maps [92.6347010295396]
対象目標ナビゲーションのための暗黙的な空間マップを提案する。
提案手法は, 挑戦的なMP3Dデータセット上での技量を著しく上回る。
我々は、実際のロボットにモデルをデプロイし、実際のシーンでオブジェクトゴールナビゲーションの結果を奨励する。
論文 参考訳(メタデータ) (2023-08-10T14:21:33Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - BEVBert: Multimodal Map Pre-training for Language-guided Navigation [75.23388288113817]
視覚・言語ナビゲーション(VLN)における空間認識型マップベース事前学習パラダイムを提案する。
我々は,グローバルなトポロジカルマップにおけるナビゲーション依存性をモデル化しながら,不完全な観測を明示的に集約し,重複を取り除くための局所距離マップを構築した。
ハイブリッドマップをベースとして,マルチモーダルマップ表現を学習するための事前学習フレームワークを考案し,空間認識型クロスモーダル推論を強化し,言語誘導ナビゲーションの目標を導出する。
論文 参考訳(メタデータ) (2022-12-08T16:27:54Z) - Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language
Navigation [87.52136927091712]
我々は,ロボットエージェントが言語指導によって記述された経路をたどって,環境の中をナビゲートするよう訓練する,現実的かつ困難な問題に対処する。
高精度かつ効率的なナビゲーションを実現するためには,環境オブジェクトの空間的位置と意味情報の両方を正確に表現した地図を構築することが重要である。
より包括的にオブジェクトを表現するために,オブジェクトの細粒度(色,テクスチャなど)とセマンティッククラスの両方を含む多粒度マップを提案する。
論文 参考訳(メタデータ) (2022-10-14T04:23:27Z) - ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints [94.60414567852536]
長距離航法には、計画と局所的な移動可能性の推論の両方が必要である。
学習と計画を統合する学習に基づくアプローチを提案する。
ViKiNGは、画像ベースの学習コントローラを利用できる。
論文 参考訳(メタデータ) (2022-02-23T02:14:23Z) - Lifelong Topological Visual Navigation [16.41858724205884]
本稿では,生涯ナビゲーション性能を時間とともに向上させるグラフ更新戦略を用いた学習型ビジュアルナビゲーション手法を提案する。
画像に基づくトポロジグラフを構築するためのサンプリングベースの計画アルゴリズムから着想を得た結果,スペーサーグラフはベースライン法に比べてナビゲーション性能が高い。
固定的なトレーニング環境から学習するコントローラとは異なり、ロボットが配置される実環境から比較的小さなデータセットを使ってモデルを微調整できることが示される。
論文 参考訳(メタデータ) (2021-10-16T06:16:14Z) - Topological Planning with Transformers for Vision-and-Language
Navigation [31.64229792521241]
トポロジカルマップを用いた視覚・言語ナビゲーション(VLN)のモジュール化手法を提案する。
自然言語指導とトポロジカルマップが与えられた場合,マップ内のナビゲーション計画を予測するために注意機構を利用する。
実験では,従来のエンドツーエンドアプローチを上回り,解釈可能なナビゲーションプランを生成し,バックトラックなどのインテリジェントな行動を示す。
論文 参考訳(メタデータ) (2020-12-09T20:02:03Z) - High-Level Plan for Behavioral Robot Navigation with Natural Language
Directions and R-NET [6.47137925955334]
我々は,経路を表す行動列をポインタネットワークが生成できるように,行動ナビゲーショングラフの理解を深める。
ナビゲーショングラフデータセットのテストでは、我々のモデルは既知の環境と未知の環境の両方において最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-01-08T01:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。