論文の概要: Beyond the Nav-Graph: Vision-and-Language Navigation in Continuous
Environments
- arxiv url: http://arxiv.org/abs/2004.02857v2
- Date: Fri, 1 May 2020 18:06:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:52:20.563952
- Title: Beyond the Nav-Graph: Vision-and-Language Navigation in Continuous
Environments
- Title(参考訳): nav-graphを超えて:連続環境における視覚・言語ナビゲーション
- Authors: Jacob Krantz, Erik Wijmans, Arjun Majumdar, Dhruv Batra, Stefan Lee
- Abstract要約: 本研究では,連続した3次元環境下での言語誘導ナビゲーションタスクの開発を行う。
連続的な環境に配置することで、この設定は以前の作業で暗黙的に多くの仮定を持ち上げる。
- 参考スコア(独自算出の注目度): 48.898567402373324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a language-guided navigation task set in a continuous 3D
environment where agents must execute low-level actions to follow natural
language navigation directions. By being situated in continuous environments,
this setting lifts a number of assumptions implicit in prior work that
represents environments as a sparse graph of panoramas with edges corresponding
to navigability. Specifically, our setting drops the presumptions of known
environment topologies, short-range oracle navigation, and perfect agent
localization. To contextualize this new task, we develop models that mirror
many of the advances made in prior settings as well as single-modality
baselines. While some of these techniques transfer, we find significantly lower
absolute performance in the continuous setting -- suggesting that performance
in prior `navigation-graph' settings may be inflated by the strong implicit
assumptions.
- Abstract(参考訳): 我々は,エージェントが自然言語ナビゲーションの指示に従うために低レベルなアクションを実行しなければならない連続3次元環境において,言語誘導型ナビゲーションタスクセットを開発する。
連続した環境に配置することで、この設定は、航海性に対応するエッジを持つパノラマのスパースグラフとして環境を表す事前の作業において暗黙的な多くの仮定を持ち上げる。
具体的には、既知の環境トポロジ、短距離オラクルナビゲーション、完璧なエージェントローカライゼーションの予測を下げる。
この新たなタスクを文脈化するために,事前設定における多くの進歩と単一モダリティベースラインを反映したモデルを開発する。
これらのテクニックのいくつかは転送されるが、連続的な設定では絶対的なパフォーマンスが著しく低いことが分かり、以前の ‘navigation-graph' 設定のパフォーマンスは、強い暗黙的な仮定によって膨らむ可能性がある。
関連論文リスト
- NavigateDiff: Visual Predictors are Zero-Shot Navigation Assistants [24.689242976554482]
慣れ親しんだ環境をナビゲートすることは、家庭用ロボットにとって大きな課題となる。
既存の強化学習手法は、直接新しい環境に移行することはできない。
我々は、事前学習された基礎モデルの論理知識と一般化能力をゼロショットナビゲーションに転送しようと試みる。
論文 参考訳(メタデータ) (2025-02-19T17:27:47Z) - UnitedVLN: Generalizable Gaussian Splatting for Continuous Vision-Language Navigation [71.97405667493477]
我々は,UnitedVLNと呼ばれる,新しい汎用3DGSベースの事前学習パラダイムを導入する。
エージェントは、高忠実度360度ビジュアルイメージとセマンティック特徴を統一してレンダリングすることで、将来の環境をよりよく探索することができる。
UnitedVLNは既存のVLN-CEベンチマークで最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-11-25T02:44:59Z) - CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.78984332354636]
CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。
将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。
ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-06-17T11:44:04Z) - Bridging the Gap Between Learning in Discrete and Continuous
Environments for Vision-and-Language Navigation [41.334731014665316]
ヴィジュアル・アンド・ランゲージ・ナビゲーション(VLN)における既存の作業のほとんどは、離散的または連続的な環境に焦点を当てている。
ナビゲーション中に候補となるウェイポイントの集合を生成するための予測器を提案する。
予測された経路点を持つ連続環境を航行するエージェントは,低レベル動作を使用するエージェントよりも有意に優れた性能を示す。
論文 参考訳(メタデータ) (2022-03-05T14:56:14Z) - Waypoint Models for Instruction-guided Navigation in Continuous
Environments [68.2912740006109]
本稿では,言語条件付きウェイポイント予測ネットワークのクラスを開発し,この問題について検討する。
プロファイリングされたLoCoBotロボット上でのタスク性能と実行時間の推定を行う。
我々のモデルは、VLN-CEにおける以前の仕事を上回り、新しい最先端の技術を公衆のリーダーボードに置きました。
論文 参考訳(メタデータ) (2021-10-05T17:55:49Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z) - Environment-agnostic Multitask Learning for Natural Language Grounded
Navigation [88.69873520186017]
本稿では,視覚言語ナビゲーション(VLN)タスクと対話履歴からのナビゲーション(NDH)タスクをシームレスにトレーニングできるマルチタスクナビゲーションモデルを提案する。
実験により、環境に依存しないマルチタスク学習は、目に見える環境と目に見えない環境の間のパフォーマンスギャップを著しく減少させることが示された。
論文 参考訳(メタデータ) (2020-03-01T09:06:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。