論文の概要: Exploitation-Guided Exploration for Semantic Embodied Navigation
- arxiv url: http://arxiv.org/abs/2311.03357v1
- Date: Mon, 6 Nov 2023 18:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 13:13:18.338236
- Title: Exploitation-Guided Exploration for Semantic Embodied Navigation
- Title(参考訳): セマンティック・エボダイドナビゲーションのための爆発誘導探索
- Authors: Justin Wasserman, Girish Chowdhary, Abhinav Gupta, Unnat Jain
- Abstract要約: Exploitation-Guided Exploration (XGX)は、探査と利用のためのモジュールを組み合わせる新しい方法である。
XGXは、挑戦的なオブジェクトナビゲーションタスクにおける最先端のパフォーマンスを70%から73%に改善する。
シミュレーションベンチマークにより,ロボットハードウェアへのシミュレート・トゥ・リアル・トランスファーを示し,XGXは最高のベースラインよりも2倍高い性能を示した。
- 参考スコア(独自算出の注目度): 22.69354210048896
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the recent progress in embodied navigation and sim-to-robot transfer,
modular policies have emerged as a de facto framework. However, there is more
to compositionality beyond the decomposition of the learning load into modular
components. In this work, we investigate a principled way to syntactically
combine these components. Particularly, we propose Exploitation-Guided
Exploration (XGX) where separate modules for exploration and exploitation come
together in a novel and intuitive manner. We configure the exploitation module
to take over in the deterministic final steps of navigation i.e. when the goal
becomes visible. Crucially, an exploitation module teacher-forces the
exploration module and continues driving an overridden policy optimization.
XGX, with effective decomposition and novel guidance, improves the
state-of-the-art performance on the challenging object navigation task from 70%
to 73%. Along with better accuracy, through targeted analysis, we show that XGX
is also more efficient at goal-conditioned exploration. Finally, we show
sim-to-real transfer to robot hardware and XGX performs over two-fold better
than the best baseline from simulation benchmarking. Project page:
xgxvisnav.github.io
- Abstract(参考訳): 組み込みナビゲーションとsim-to-robot転送の最近の進歩の中で、モジュラポリシはデファクトフレームワークとして現れている。
しかし、構成性には学習負荷をモジュールコンポーネントに分解する以上のものがある。
本研究では,これらの成分を統語的に組み合わせる原理的な方法を検討する。
特に,探索と活用のためのモジュールを新規かつ直感的に結合するエクスプロイトガイド探索(xgx)を提案する。
本手法では,ナビゲーションの最終段階,すなわち目標が目に見えるように,エクスプロイトモジュールを設定している。
重要なのは、エクスプロイテーションモジュールが探索モジュールを教師に強制し、過度なポリシー最適化を継続することです。
XGXは、効率的な分解と新しいガイダンスにより、挑戦対象ナビゲーションタスクの最先端性能を70%から73%に向上させる。
目標分析による精度の向上とともに,目標条件探索において,XGXはより効率的であることを示す。
最後に,ロボットハードウェアへのsim-to-real転送を示し,XGXはシミュレーションベンチマークのベースラインよりも2倍高い性能を示した。
プロジェクトページ: xgxvisnav.github.io
関連論文リスト
- DISCO: Embodied Navigation and Interaction via Differentiable Scene Semantics and Dual-level Control [53.80518003412016]
人間の命令によって多様なタスクに熟練した汎用的なインテリジェントホームアシストエージェントを構築することは、AI研究の長期的青写真である。
本研究では,具体的エージェントに対する原始的移動操作,すなわち指示された動詞と名詞のペアに基づいて,ナビゲートと対話の仕方について検討する。
本研究では、文脈化されたシーンモデリングと効率的な制御における非自明な進歩を特徴とするdisCOを提案する。
論文 参考訳(メタデータ) (2024-07-20T05:39:28Z) - NoMaD: Goal Masked Diffusion Policies for Navigation and Exploration [57.15811390835294]
本稿では,目標指向ナビゲーションと目標非依存探索の両方を扱うために,単一の統合拡散政策をトレーニングする方法について述べる。
この統一された政策は、新しい環境における目標を視覚的に示す際に、全体的な性能が向上することを示す。
実世界の移動ロボットプラットフォーム上で実施した実験は,5つの代替手法と比較して,見えない環境における効果的なナビゲーションを示す。
論文 参考訳(メタデータ) (2023-10-11T21:07:14Z) - Robust Navigation with Cross-Modal Fusion and Knowledge Transfer [16.529923581195753]
移動ロボットの一般化に関する問題点を考察する。
一般化のためのクロスモーダル融合法と知識伝達フレームワークを提案する。
教師の行動と表現を模倣することにより、学生はノイズの多いマルチモーダル入力から特徴を調整できる。
論文 参考訳(メタデータ) (2023-09-23T05:16:35Z) - CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.78984332354636]
CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。
将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。
ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-06-17T11:44:04Z) - Can an Embodied Agent Find Your "Cat-shaped Mug"? LLM-Guided Exploration
for Zero-Shot Object Navigation [58.3480730643517]
言語駆動型ゼロショットオブジェクトゴールナビゲーション(L-ZSON)のための新しいアルゴリズムLGXを提案する。
このアプローチでは、このタスクにLarge Language Models(LLM)を使用します。
現状のゼロショットオブジェクトナビゲーションをRoboTHOR上で実現し,現在のベースラインよりも27%以上の成功率(SR)向上を実現した。
論文 参考訳(メタデータ) (2023-03-06T20:19:19Z) - Navigating to Objects in the Real World [76.1517654037993]
本稿では,古典的,モジュール的,エンド・ツー・エンドの学習手法と比較した,意味的視覚ナビゲーション手法に関する大規模な実証的研究について述べる。
モジュラー学習は実世界ではうまく機能し、90%の成功率に達しています。
対照的に、エンド・ツー・エンドの学習は、シミュレーションと現実の間の画像領域の差が大きいため、77%のシミュレーションから23%の実際の成功率へと低下する。
論文 参考訳(メタデータ) (2022-12-02T01:10:47Z) - Last-Mile Embodied Visual Navigation [31.622495628224403]
本稿では,画像ゴールナビゲーションシステムの性能向上を目的としたSlingを提案する。
我々は、ラストマイルナビゲーションに焦点をあて、ニューラルディスクリプタ問題の基礎となる幾何学的構造を活用する。
標準化された画像ゴールナビゲーションベンチマークでは、ポリシー、シーン、エピソードの複雑さにまたがるパフォーマンスを改善し、最先端の45%から55%の成功率に引き上げる。
論文 参考訳(メタデータ) (2022-11-21T18:59:58Z) - PIC4rl-gym: a ROS2 modular framework for Robots Autonomous Navigation
with Deep Reinforcement Learning [0.4588028371034407]
この研究は、ナビゲーションと学習の研究を強化するための基本的なモジュラーフレームワークであるtextitPIC4rl-gymを導入している。
本稿では、DRLエージェントのトレーニングとテストを完全に統合したPIC4rl-gymの全体構造について述べる。
モジュラーアプローチは、新しいプラットフォーム、センサー、モデルを選択することで、シミュレーションを簡単にカスタマイズするために採用されている。
論文 参考訳(メタデータ) (2022-11-19T14:58:57Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。