論文の概要: Auxiliary Tasks Speed Up Learning PointGoal Navigation
- arxiv url: http://arxiv.org/abs/2007.04561v2
- Date: Wed, 4 Nov 2020 20:29:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 04:07:20.536604
- Title: Auxiliary Tasks Speed Up Learning PointGoal Navigation
- Title(参考訳): 補助タスクが学習ポイントゴーアナビゲーションを高速化
- Authors: Joel Ye, Dhruv Batra, Erik Wijmans, Abhishek Das
- Abstract要約: PointGoal Navigationは、エージェントが見えない環境で指定されたポイントにナビゲートする必要がある、具体化されたタスクである。
本研究では,自己指導型補助タスクを用いたPointNav学習において,サンプルと時間効率を大幅に向上させる手法を開発した。
我々のベストエージェントは従来のDD-PPOを40Mフレームで5.5倍高速化し、DD-PPOの性能を0.16SPLで向上させる。
- 参考スコア(独自算出の注目度): 41.820289202253235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: PointGoal Navigation is an embodied task that requires agents to navigate to
a specified point in an unseen environment. Wijmans et al. showed that this
task is solvable but their method is computationally prohibitive, requiring 2.5
billion frames and 180 GPU-days. In this work, we develop a method to
significantly increase sample and time efficiency in learning PointNav using
self-supervised auxiliary tasks (e.g. predicting the action taken between two
egocentric observations, predicting the distance between two observations from
a trajectory,etc.).We find that naively combining multiple auxiliary tasks
improves sample efficiency,but only provides marginal gains beyond a point. To
overcome this, we use attention to combine representations learnt from
individual auxiliary tasks. Our best agent is 5.5x faster to reach the
performance of the previous state-of-the-art, DD-PPO, at 40M frames, and
improves on DD-PPO's performance at 40M frames by 0.16 SPL. Our code is
publicly available at https://github.com/joel99/habitat-pointnav-aux.
- Abstract(参考訳): pointgoal navigationは、エージェントが見えない環境で特定のポイントにナビゲートする必要がある、具体化されたタスクである。
Wijmansらは、このタスクは解決可能であるが、その方法は計算的に禁止されており、25億フレームと180GPU日を必要とすることを示した。
本研究では,自己教師付き補助タスクを用いたポイントnav学習におけるサンプルと時間効率を著しく向上させる手法(例えば,2つの自己中心的観測間の動作を予測し,2つの観測間の距離を軌道から予測するなど)を開発した。
複数の補助的タスクを鼻で組み合わせることで、サンプル効率が向上するが、1点以上の利得しか得られない。
これを解決するために、個々の補助タスクから学習した表現を組み合わせるために注意を払っています。
我々のベストエージェントは従来のDD-PPOを40Mフレームで5.5倍高速化し、DD-PPOの性能を0.16SPLで向上させる。
私たちのコードはhttps://github.com/joel99/habitat-pointnav-auxで公開されています。
関連論文リスト
- Memory Proxy Maps for Visual Navigation [6.1190419149081245]
視覚的なナビゲーションは人間からインスピレーションを受け、視覚を使って、詳細な環境マップを使わずに、これまで見えなかった環境をナビゲートする。
これに触発されて、封建的学習を用いた視覚ナビゲーションのための、No-RL、No-graph、No-odometryアプローチを導入し、3つのタイレッドエージェントを構築した。
論文 参考訳(メタデータ) (2024-11-15T02:37:14Z) - MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation [3.9974562667271507]
視覚計測(VO)は,室内環境におけるエンボディエージェントの正確なポイントゴールナビゲーションを可能にするために不可欠である。
近年の深層学習VO法は, 頑健な性能を示すが, トレーニング中のサンプル不効率に悩まされている。
エージェントが環境をナビゲートしている間に利用可能な動作先に基づいて、ロバストでサンプル効率の良いVOパイプラインを提案する。
論文 参考訳(メタデータ) (2024-11-07T15:36:49Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Waypoint Models for Instruction-guided Navigation in Continuous
Environments [68.2912740006109]
本稿では,言語条件付きウェイポイント予測ネットワークのクラスを開発し,この問題について検討する。
プロファイリングされたLoCoBotロボット上でのタスク性能と実行時間の推定を行う。
我々のモデルは、VLN-CEにおける以前の仕事を上回り、新しい最先端の技術を公衆のリーダーボードに置きました。
論文 参考訳(メタデータ) (2021-10-05T17:55:49Z) - Auxiliary Tasks and Exploration Enable ObjectNav [48.314102158070874]
補助学習タスクと探索報酬を追加することで,汎用学習エージェントを再生成する。
われわれのエージェントは24.5%の成功、8.1%のSPL、それぞれ37%と8%の相対的な改善を達成している。
論文 参考訳(メタデータ) (2021-04-08T23:03:21Z) - Work in Progress: Temporally Extended Auxiliary Tasks [13.605130745835638]
本稿では、時間差学習を用いて、政治上の予測を学習する補助的タスクについて考察する。
我々は,VizDoom環境における時間差オートエンコーダ(TD-AE)のA2Cアルゴリズムへの影響を実験的に評価した。
論文 参考訳(メタデータ) (2020-04-01T17:36:14Z) - Meta Reinforcement Learning with Autonomous Inference of Subtask
Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。
メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。
実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文 参考訳(メタデータ) (2020-01-01T17:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。