論文の概要: MultiON: Benchmarking Semantic Map Memory using Multi-Object Navigation
- arxiv url: http://arxiv.org/abs/2012.03912v1
- Date: Mon, 7 Dec 2020 18:42:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 08:25:37.336116
- Title: MultiON: Benchmarking Semantic Map Memory using Multi-Object Navigation
- Title(参考訳): MultiON:マルチオブジェクトナビゲーションを用いた意味マップメモリのベンチマーク
- Authors: Saim Wani, Shivansh Patel, Unnat Jain, Angel X. Chang, Manolis Savva
- Abstract要約: 最近の研究は、地図のようなメモリが長距離ナビゲーションタスクに有用であることを示している。
本稿では,実環境において,エピソード特有のオブジェクト列へのナビゲーションを必要とするマルチオンタスクを提案する。
様々なエージェントモデルがナビゲーションタスクの複雑度をまたいでどのように振る舞うかを検討する。
- 参考スコア(独自算出の注目度): 23.877609358505268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Navigation tasks in photorealistic 3D environments are challenging because
they require perception and effective planning under partial observability.
Recent work shows that map-like memory is useful for long-horizon navigation
tasks. However, a focused investigation of the impact of maps on navigation
tasks of varying complexity has not yet been performed. We propose the multiON
task, which requires navigation to an episode-specific sequence of objects in a
realistic environment. MultiON generalizes the ObjectGoal navigation task and
explicitly tests the ability of navigation agents to locate previously observed
goal objects. We perform a set of multiON experiments to examine how a variety
of agent models perform across a spectrum of navigation task complexities. Our
experiments show that: i) navigation performance degrades dramatically with
escalating task complexity; ii) a simple semantic map agent performs
surprisingly well relative to more complex neural image feature map agents; and
iii) even oracle map agents achieve relatively low performance, indicating the
potential for future work in training embodied navigation agents using maps.
Video summary: https://youtu.be/yqTlHNIcgnY
- Abstract(参考訳): フォトリアリスティックな3d環境におけるナビゲーションタスクは、部分的可観測性の下で知覚と効果的な計画を必要とするため、困難である。
最近の研究は、地図のようなメモリが長距離ナビゲーションタスクに有用であることを示している。
しかし、地図が様々な複雑さのナビゲーションタスクに与える影響についての研究はまだ行われていない。
本稿では,実環境において,エピソード特有のオブジェクト列へのナビゲーションを必要とするマルチオンタスクを提案する。
MultiONはObjectGoalナビゲーションタスクを一般化し、ナビゲーションエージェントが以前に観測されたゴールオブジェクトを見つける能力を明示的にテストする。
マルチオン実験を行い,様々なエージェントモデルがナビゲーションタスクの複雑度を横断してどのように振る舞うかを検証した。
実験の結果, ナビゲーション性能は, タスクの複雑さを増大させるとともに劇的に低下することがわかった。i) 単純な意味地図エージェントは, より複雑なニューラルイメージ特徴マップエージェントと比較して驚くほどよく機能し, iii) オラクルマップエージェントでさえ比較的低い性能を達成し, 地図を用いた具体化ナビゲーションエージェントの訓練における今後の作業の可能性を示している。
ビデオ要約: https://youtu.be/yqTlHNIcgnY
関連論文リスト
- SayNav: Grounding Large Language Models for Dynamic Planning to Navigation in New Environments [14.179677726976056]
SayNavは、Large Language Models(LLM)からの人間の知識を活用して、複雑なナビゲーションタスクを効率的に一般化する新しいアプローチである。
SayNavは最先端の結果を達成し、成功率の点で強烈な地道的な仮定でオラクルベースのベースラインを8%以上上回ります。
論文 参考訳(メタデータ) (2023-09-08T02:24:37Z) - Object Goal Navigation with Recursive Implicit Maps [92.6347010295396]
対象目標ナビゲーションのための暗黙的な空間マップを提案する。
提案手法は, 挑戦的なMP3Dデータセット上での技量を著しく上回る。
我々は、実際のロボットにモデルをデプロイし、実際のシーンでオブジェクトゴールナビゲーションの結果を奨励する。
論文 参考訳(メタデータ) (2023-08-10T14:21:33Z) - Towards Versatile Embodied Navigation [120.73460380993305]
ウィーンは多機能なエンボディナビゲーションエージェントであり、同時に4つのナビゲーションタスクを1つのモデルで実行することを学ぶ。
視覚的なナビゲーションタスクを個別に学習するのに対し、エージェントは複雑さを減らして同等またはそれ以上の性能を達成することを実証的に実証した。
論文 参考訳(メタデータ) (2022-10-30T11:53:49Z) - Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language
Navigation [87.52136927091712]
我々は,ロボットエージェントが言語指導によって記述された経路をたどって,環境の中をナビゲートするよう訓練する,現実的かつ困難な問題に対処する。
高精度かつ効率的なナビゲーションを実現するためには,環境オブジェクトの空間的位置と意味情報の両方を正確に表現した地図を構築することが重要である。
より包括的にオブジェクトを表現するために,オブジェクトの細粒度(色,テクスチャなど)とセマンティッククラスの両方を含む多粒度マップを提案する。
論文 参考訳(メタデータ) (2022-10-14T04:23:27Z) - Multi-Agent Embodied Visual Semantic Navigation with Scene Prior
Knowledge [42.37872230561632]
視覚的セマンティックナビゲーションでは、ロボットは自我中心の視覚的観察を行い、目標のクラスラベルが与えられる。
既存のモデルのほとんどは単一エージェントナビゲーションにのみ有効であり、より複雑なタスクを完了すると、単一のエージェントは低効率でフォールトトレランスが低い。
本稿では,複数のエージェントが協調して複数の対象物を見つけるマルチエージェント視覚意味ナビゲーションを提案する。
論文 参考訳(メタデータ) (2021-09-20T13:31:03Z) - Learning Synthetic to Real Transfer for Localization and Navigational
Tasks [7.019683407682642]
ナビゲーションは、コンピュータビジョン、ロボット工学、制御の概念を組み合わせて、複数の分野のクロスロードにある。
この研究は、実世界への移動をできる限り少ない努力で行うことができるナビゲーションパイプラインをシミュレーションで作成することを目的としていた。
ナビゲーションパイプラインを設計するには、環境、ローカライゼーション、ナビゲーション、計画の4つの大きな課題が発生する。
論文 参考訳(メタデータ) (2020-11-20T08:37:03Z) - Occupancy Anticipation for Efficient Exploration and Navigation [97.17517060585875]
そこで我々は,エージェントが自我中心のRGB-D観測を用いて,その占有状態を可視領域を超えて推定する,占有予測を提案する。
エゴセントリックなビューとトップダウンマップの両方でコンテキストを活用することで、私たちのモデルは環境のより広いマップを予測できます。
われわれのアプローチは、2020 Habitat PointNav Challengeの優勝だ。
論文 参考訳(メタデータ) (2020-08-21T03:16:51Z) - Active Visual Information Gathering for Vision-Language Navigation [115.40768457718325]
視覚言語ナビゲーション(VLN)は、エージェントがフォトリアリスティックな環境の中でナビゲーションの指示を行うためのタスクである。
VLNの重要な課題の1つは、曖昧な指示による不確実性を緩和し、環境の観察を不十分にすることで、堅牢なナビゲーションを行う方法である。
この研究は、人間のナビゲーション行動からインスピレーションを得て、よりインテリジェントなVLNポリシーのためのアクティブな情報収集能力を持つエージェントを提供する。
論文 参考訳(メタデータ) (2020-07-15T23:54:20Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。