論文の概要: Structured Exploration Through Instruction Enhancement for Object
Navigation
- arxiv url: http://arxiv.org/abs/2211.08467v1
- Date: Tue, 15 Nov 2022 19:39:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 15:03:32.056103
- Title: Structured Exploration Through Instruction Enhancement for Object
Navigation
- Title(参考訳): 物体ナビゲーションのための指示強化による構造化探索
- Authors: Matthias Hutsebaut-Buysse, Kevin Mets, Tom De Schepper, Steven Latr\'e
- Abstract要約: 本稿では,オブジェクトナビゲーションのための階層型学習手法を提案する。
トップレベルはハイレベルなプランニングが可能で、フロアプランレベルでメモリを構築することができる。
本研究では,本手法が動的家庭環境に与える影響を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Finding an object of a specific class in an unseen environment remains an
unsolved navigation problem. Hence, we propose a hierarchical learning-based
method for object navigation. The top-level is capable of high-level planning,
and building a memory on a floorplan-level (e.g., which room makes the most
sense for the agent to visit next, where has the agent already been?). While
the lower-level is tasked with efficiently navigating between rooms and looking
for objects in them. Instructions can be provided to the agent using a simple
synthetic language. The top-level intelligently enhances the instructions in
order to make the overall task more tractable. Language grounding, mapping
instructions to visual observations, is performed by utilizing an additional
separate supervised trained goal assessment module. We demonstrate the
effectiveness of our method on a dynamic configurable domestic environment.
- Abstract(参考訳): 見えない環境で特定のクラスのオブジェクトを見つけることは、未解決のナビゲーション問題である。
そこで本研究では,オブジェクトナビゲーションのための階層型学習手法を提案する。
トップレベルは高レベルな計画が可能で、フロアプランレベルでメモリを構築することができる(例えば、エージェントが次に訪れるのに一番意味のある部屋は、エージェントがすでにどこにいたか?
下位層は部屋の間を効率的に行き来し、その中のオブジェクトを探す。
簡単な合成言語を用いて、エージェントに指示を与えることができる。
トップレベルは、全体的なタスクをより魅力的にするために、命令をインテリジェントに強化する。
言語接地、視覚観察へのマッピング指示は、別々に訓練された目標評価モジュールを用いて行われる。
動的構成可能な家庭環境における本手法の有効性を実証する。
関連論文リスト
- DISCO: Embodied Navigation and Interaction via Differentiable Scene Semantics and Dual-level Control [53.80518003412016]
人間の命令によって多様なタスクに熟練した汎用的なインテリジェントホームアシストエージェントを構築することは、AI研究の長期的青写真である。
本研究では,具体的エージェントに対する原始的移動操作,すなわち指示された動詞と名詞のペアに基づいて,ナビゲートと対話の仕方について検討する。
本研究では、文脈化されたシーンモデリングと効率的な制御における非自明な進歩を特徴とするdisCOを提案する。
論文 参考訳(メタデータ) (2024-07-20T05:39:28Z) - Embodied Instruction Following in Unknown Environments [66.60163202450954]
未知環境における複雑なタスクに対するEIF(Embodied instruction following)法を提案する。
我々は,ハイレベルなタスクプランナと低レベルな探索コントローラを含む,階層的な具体化命令に従うフレームワークを構築した。
タスクプランナに対しては、タスク完了プロセスと既知の視覚的手がかりに基づいて、人間の目標達成のための実行可能なステップバイステッププランを生成する。
論文 参考訳(メタデータ) (2024-06-17T17:55:40Z) - Aligning Knowledge Graph with Visual Perception for Object-goal Navigation [16.32780793344835]
オブジェクトゴールナビゲーションのための視覚知覚付きアライニング知識グラフ(AKGVP)を提案する。
提案手法では,階層型シーンアーキテクチャの連続的モデリングを導入し,自然言語記述と視覚知覚との整合性を確保するために,視覚-言語事前学習を活用する。
継続的知識グラフアーキテクチャとマルチモーダル機能アライメントの統合により、ナビゲータは目覚ましいゼロショットナビゲーション能力を持つ。
論文 参考訳(メタデータ) (2024-02-29T06:31:18Z) - Weakly-Supervised Multi-Granularity Map Learning for Vision-and-Language
Navigation [87.52136927091712]
我々は,ロボットエージェントが言語指導によって記述された経路をたどって,環境の中をナビゲートするよう訓練する,現実的かつ困難な問題に対処する。
高精度かつ効率的なナビゲーションを実現するためには,環境オブジェクトの空間的位置と意味情報の両方を正確に表現した地図を構築することが重要である。
より包括的にオブジェクトを表現するために,オブジェクトの細粒度(色,テクスチャなど)とセマンティッククラスの両方を含む多粒度マップを提案する。
論文 参考訳(メタデータ) (2022-10-14T04:23:27Z) - PONI: Potential Functions for ObjectGoal Navigation with
Interaction-free Learning [125.22462763376993]
対話自由学習(PONI)を用いたオブジェクト指向ナビゲーションの可能性について提案する。
PONIは、物がどこに見えるかというスキルと、どのように(x, y)にナビゲートするかを歪めます。」
論文 参考訳(メタデータ) (2022-01-25T01:07:32Z) - Learning Embeddings that Capture Spatial Semantics for Indoor Navigation [2.2940141855172027]
本研究では,空間的セマンティックな先行情報をキャプチャするオブジェクトの埋め込みによって,構造化された環境における探索やナビゲーションのタスクをガイドする方法について検討する。
本研究では,事前学習された言語モデルと多言語知識ベースをオブジェクト埋め込みとして活用することにより,そのような空間意味認識をロボットに組み込む手法を提案する。
論文 参考訳(メタデータ) (2021-07-31T06:12:40Z) - Are We There Yet? Learning to Localize in Embodied Instruction Following [1.7300690315775575]
Action Learning From Realistic Environments and Directives (ALFRED)は、この問題に対する最近提案されたベンチマークである。
このタスクの主な課題は、ターゲット位置のローカライズと、視覚的な入力によるナビゲーションである。
ナビゲーションサブゴール中のエージェントの視野を複数の視野角で拡張し、各タイムステップでターゲット位置に対する相対的な空間的関係を予測するようにエージェントを訓練します。
論文 参考訳(メタデータ) (2021-01-09T21:49:41Z) - ArraMon: A Joint Navigation-Assembly Instruction Interpretation Task in
Dynamic Environments [85.81157224163876]
我々は、収集したオブジェクトを組み立てるビジョン・アンド・ランゲージナビゲーションとオブジェクト参照表現理解を組み合わせることで、新しい共同ナビゲーション・アンド・アセンブリタスク、ArraMonを作成します。
この作業中、エージェントは、複雑で現実的な屋外環境において、自然言語の指示に基づいてナビゲートすることで、異なる対象物を1対1で見つけ、収集するよう依頼される。
我々は,いくつかのベースラインモデル(積分とバイアス)とメトリクス(nDTW, CTC, rPOD, PTC)の結果を提示する。
論文 参考訳(メタデータ) (2020-11-15T23:30:36Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。