Fugu-MT 論文翻訳(概要): Instance-Specific Image Goal Navigation: Training Embodied Agents to Find Object Instances

論文の概要: Instance-Specific Image Goal Navigation: Training Embodied Agents to Find Object Instances

arxiv url: http://arxiv.org/abs/2211.15876v1
Date: Tue, 29 Nov 2022 02:29:35 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-30 16:22:30.685745
Title: Instance-Specific Image Goal Navigation: Training Embodied Agents to Find Object Instances
Title（参考訳）: インスタンス固有のイメージ目標ナビゲーション: オブジェクトインスタンスを見つけるための具体化エージェントのトレーニング
Authors: Jacob Krantz, Stefan Lee, Jitendra Malik, Dhruv Batra, Devendra Singh Chaplot
Abstract要約: 画像ゴールによる視覚ナビゲーションの具体化問題(ImageNav)について考察する。関連するナビゲーションタスクとは異なり、ImageNavはメソッド間の比較を難しくする標準化されたタスク定義を持っていない。これらの制限に対処するために、インスタンス固有のImageNavタスク(ImageNav)を提示します。
参考スコア（独自算出の注目度）: 90.61897965658183
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We consider the problem of embodied visual navigation given an image-goal (ImageNav) where an agent is initialized in an unfamiliar environment and tasked with navigating to a location 'described' by an image. Unlike related navigation tasks, ImageNav does not have a standardized task definition which makes comparison across methods difficult. Further, existing formulations have two problematic properties; (1) image-goals are sampled from random locations which can lead to ambiguity (e.g., looking at walls), and (2) image-goals match the camera specification and embodiment of the agent; this rigidity is limiting when considering user-driven downstream applications. We present the Instance-specific ImageNav task (InstanceImageNav) to address these limitations. Specifically, the goal image is 'focused' on some particular object instance in the scene and is taken with camera parameters independent of the agent. We instantiate InstanceImageNav in the Habitat Simulator using scenes from the Habitat-Matterport3D dataset (HM3D) and release a standardized benchmark to measure community progress.
Abstract（参考訳）: エージェントが未知の環境で初期化され、画像によって「記述された」位置へナビゲートされるイメージゴーアル(imagenav)が与えられた場合、具体化されたビジュアルナビゲーションの問題を考える。関連するナビゲーションタスクとは異なり、ImageNavはメソッド間の比較が難しい標準化されたタスク定義を持っていない。さらに、既存の定式化は、(1)曖昧性(例えば壁を見る)につながるランダムな場所から画像ゴールをサンプリングし、(2)画像ゴールは、カメラ仕様とエージェントの具体化と一致し、この剛性は、ユーザ主導の下流アプリケーションを考える際に制限される。これらの制限に対処するために、インスタンス固有のImageNavタスク(インスタンスImageNav)を提示します。具体的には、ゴールイメージはシーン内の特定のオブジェクトインスタンスに'フォーカス'され、エージェントに依存しないカメラパラメータで撮影される。 habitat-matterport3d dataset(hm3d)のシーンを使用して、habitat simulatorのインスタンスimagenavをインスタンス化し、コミュニティの進捗を測定するための標準ベンチマークをリリースします。

関連論文リスト

Personalized Instance-based Navigation Toward User-Specific Objects in Realistic Environments [44.6372390798904]
本稿では,特定の個人オブジェクトの位置と到達を具体化するタスクデノマイトされたパーソナライズされたパーソナライズドインスタンスベースのナビゲーション(PIN)を提案する。各エピソードにおいて、ターゲットオブジェクトは、中性背景上の視覚的参照画像のセットと手動による注釈付きテキスト記述の2つのモードを使用してエージェントに提示される。
論文参考訳（メタデータ） (2024-10-23T18:01:09Z)
Prioritized Semantic Learning for Zero-shot Instance Navigation [2.537056548731396]
我々はゼロショットのインスタンスナビゲーションについて研究し、エージェントはトレーニングにオブジェクトアノテーションを使わずに特定のオブジェクトにナビゲートする。本稿では,ナビゲーションエージェントのセマンティック理解能力を向上させるために,優先度付き意味学習(PSL)手法を提案する。我々のPSLエージェントは、0ショットのObjectNavにおいて、0ショットのObjectNavを66%上回り、新しいInstanceNavタスクよりも優れている。
論文参考訳（メタデータ） (2024-03-18T10:45:50Z)
GaussNav: Gaussian Splatting for Visual Navigation [92.13664084464514]
インスタンスイメージゴールナビゲーション(IIN)では、エージェントが探索されていない環境で、目標画像に描かれた特定のオブジェクトを見つける必要がある。我々のフレームワークは3次元ガウススプラッティングに基づく新しい地図表現を構築する(3DGS) 我々のフレームワークは、Habitat-Matterport 3D(HM3D)データセットに挑戦するPath Length(SPL)が0.252から0.578に重み付けしたSuccessの増加によって証明された、パフォーマンスの著しい飛躍を示す。
論文参考訳（メタデータ） (2024-03-18T09:56:48Z)
Instance-aware Exploration-Verification-Exploitation for Instance ImageGoal Navigation [88.84058353659107]
インスタンスイメージゴールナビゲーション(IIN)は、探索されていない環境でゴールイメージによって表現された指定されたオブジェクトにナビゲートすることを目的としている。本稿では、インスタンスレベルの画像目標ナビゲーションのための新しいモジュール型ナビゲーションフレームワーク、Exploration-Verification-Exploitation (IEVE)を提案する。我々の手法は従来の最先端の手法を超越し、古典的セグメンテーションモデル(0.684対0.561成功)またはロバストモデル(0.702対0.561成功)を用いる。
論文参考訳（メタデータ） (2024-02-25T07:59:10Z)
Navigating to Objects Specified by Images [86.9672766351891]
シミュレーションと実世界の両方でタスクを実行できるシステムを提案する。我々のモジュラー手法は探索,ゴールインスタンスの再識別,ゴールローカライゼーション,ローカルナビゲーションのサブタスクを解決する。 HM3D InstanceImageNavベンチマークでは、このシステムはベースラインのエンドツーエンドのRLポリシー7xと最先端のImageNavモデル2.3xを上回っている。
論文参考訳（メタデータ） (2023-04-03T17:58:00Z)
ObjectNav Revisited: On Evaluation of Embodied Agents Navigating to Objects [119.46959413000594]
この文書は、ObjectNavのワーキンググループのコンセンサスレコメンデーションを要約します。評価基準の微妙だが重要な詳細について推奨する。 CVPR 2020のEmbodied AIワークショップで実施された課題において、これらの推奨事項のインスタンス化について、詳細な説明を行う。
論文参考訳（メタデータ） (2020-06-23T17:18:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。