論文の概要: Reduce, Reuse, Recycle: Modular Multi-Object Navigation
- arxiv url: http://arxiv.org/abs/2304.03696v1
- Date: Fri, 7 Apr 2023 15:32:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-10 11:36:55.766861
- Title: Reduce, Reuse, Recycle: Modular Multi-Object Navigation
- Title(参考訳): Reduce, Reuse, Recycle: Modular Multi-Object Navigation
- Authors: Sonia Raychaudhuri, Tommaso Campari, Unnat Jain, Manolis Savva, Angel
X. Chang
- Abstract要約: この作業ではナビゲーションと探索モジュールに重点を置いています。
我々は,MultiONタスクにおいて,スクラッチからナビゲーションを学ぶのではなく,PointGoalナビゲーションモデルを効果的に活用できることを示す。
また、アプローチのためのテストベッドとして、新しい大規模データセットであるMultiON 2.0も作成しています。
- 参考スコア(独自算出の注目度): 25.08062891107056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our work focuses on the Multi-Object Navigation (MultiON) task, where an
agent needs to navigate to multiple objects in a given sequence. We
systematically investigate the inherent modularity of this task by dividing our
approach to contain four modules: (a) an object detection module trained to
identify objects from RGB images, (b) a map building module to build a semantic
map of the observed objects, (c) an exploration module enabling the agent to
explore its surroundings, and finally (d) a navigation module to move to
identified target objects. We focus on the navigation and the exploration
modules in this work. We show that we can effectively leverage a PointGoal
navigation model in the MultiON task instead of learning to navigate from
scratch. Our experiments show that a PointGoal agent-based navigation module
outperforms analytical path planning on the MultiON task. We also compare
exploration strategies and surprisingly find that a random exploration strategy
significantly outperforms more advanced exploration methods. We additionally
create MultiON 2.0, a new large-scale dataset as a test-bed for our approach.
- Abstract(参考訳): 私たちの仕事は、エージェントが所定のシーケンスで複数のオブジェクトにナビゲートする必要があるマルチオブジェクトナビゲーション(multion)タスクに焦点を当てています。
4つのモジュールを含むアプローチを分割することで、このタスクの固有のモジュラリティを体系的に調査します。
(a)RGB画像からオブジェクトを識別するよう訓練されたオブジェクト検出モジュール
(b)観測対象のセマンティックマップを構築するためのマップ構築モジュール
(c) エージェントが周囲を探索できる探索モジュール、そして最後に
(d) 特定対象オブジェクトに移動するためのナビゲーションモジュール。
この作業ではナビゲーションと探索モジュールに重点を置いています。
我々は,スクラッチからナビゲートを学習する代わりに,マルチオンタスクでポイントゴーアナビゲーションモデルを効果的に活用できることを示す。
実験の結果、PointGoalエージェントベースのナビゲーションモジュールは、MultiONタスクにおける解析経路計画よりも優れていることがわかった。
また,探索戦略を比較した結果,ランダム探索戦略がより高度な探査手法を大幅に上回っていることがわかった。
また、我々のアプローチのテストベッドとして、新しい大規模データセットであるMultiON 2.0も作成します。
関連論文リスト
- MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains [4.941781282578696]
Vision-and-Language Navigation (VLN)タスクでは、エージェントは自然言語の指示に従って目的地に向かう必要がある。
学習ベースのアプローチはタスクに対する主要な解決策だが、高いトレーニングコストと解釈可能性の欠如に悩まされている。
近年、Large Language Models (LLMs) は強力な一般化能力のため、VLNにとって有望なツールとして登場した。
論文 参考訳(メタデータ) (2024-05-17T08:33:27Z) - Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation [88.84058353659107]
インスタンスイメージゴールナビゲーション(IIN)は、探索されていない環境でゴールイメージによって表現された指定されたオブジェクトにナビゲートすることを目的としている。
本稿では、インスタンスレベルの画像目標ナビゲーションのための新しいモジュール型ナビゲーションフレームワーク、Exploration-Verification-Exploitation (IEVE)を提案する。
我々の手法は従来の最先端の手法を超越し、古典的セグメンテーションモデル(0.684対0.561成功)またはロバストモデル(0.702対0.561成功)を用いる。
論文 参考訳(メタデータ) (2024-02-25T07:59:10Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - Long-HOT: A Modular Hierarchical Approach for Long-Horizon Object
Transport [83.06265788137443]
我々は、時間的拡張ナビゲーションのための新しいオブジェクトトランスポートタスクと新しいモジュラーフレームワークを提案することで、長距離探査と航法を具現化する上で重要な課題に対処する。
私たちの最初の貢献は、深層探査と長期計画に焦点を当てた新しいLong-HOT環境の設計である。
重み付けされたフロンティアの助けを借りて探索を行うために,シーンのトポロジカルグラフを構築するモジュラー階層輸送ポリシー(HTP)を提案する。
論文 参考訳(メタデータ) (2022-10-28T05:30:49Z) - PONI: Potential Functions for ObjectGoal Navigation with
Interaction-free Learning [125.22462763376993]
対話自由学習(PONI)を用いたオブジェクト指向ナビゲーションの可能性について提案する。
PONIは、物がどこに見えるかというスキルと、どのように(x, y)にナビゲートするかを歪めます。」
論文 参考訳(メタデータ) (2022-01-25T01:07:32Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - SGoLAM: Simultaneous Goal Localization and Mapping for Multi-Object Goal
Navigation [5.447924312563365]
マルチオブジェクトゴールナビゲーションのためのシンプルで効率的なアルゴリズムであるSGoLAMを提案する。
RGB-DカメラとGPS/センサーを装備したエージェントを前提として,現実的な3D環境下でターゲットオブジェクトの列に移動させることが目的である。
SGoLAMはCVPR 2021 MultiON(Multi-Object Goal Navigation)の2位にランクインしている。
論文 参考訳(メタデータ) (2021-10-14T06:15:14Z) - MM-FSOD: Meta and metric integrated few-shot object detection [14.631208179789583]
メトリクス学習とメタラーニングを統合した効果的なオブジェクト検出フレームワーク(MM-FSOD)を提案する。
我々のモデルは、トレーニングサンプルにない新しいカテゴリを正確に認識できるクラスに依存しない検出モデルである。
論文 参考訳(メタデータ) (2020-12-30T14:02:52Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。