Fugu-MT 論文翻訳(概要): Auxiliary Tasks Speed Up Learning PointGoal Navigation

論文の概要: Auxiliary Tasks Speed Up Learning PointGoal Navigation

arxiv url: http://arxiv.org/abs/2007.04561v2
Date: Wed, 4 Nov 2020 20:29:06 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-12 04:07:20.536604
Title: Auxiliary Tasks Speed Up Learning PointGoal Navigation
Title（参考訳）: 補助タスクが学習ポイントゴーアナビゲーションを高速化
Authors: Joel Ye, Dhruv Batra, Erik Wijmans, Abhishek Das
Abstract要約: PointGoal Navigationは、エージェントが見えない環境で指定されたポイントにナビゲートする必要がある、具体化されたタスクである。本研究では,自己指導型補助タスクを用いたPointNav学習において,サンプルと時間効率を大幅に向上させる手法を開発した。我々のベストエージェントは従来のDD-PPOを40Mフレームで5.5倍高速化し、DD-PPOの性能を0.16SPLで向上させる。
参考スコア（独自算出の注目度）: 41.820289202253235
License: http://creativecommons.org/licenses/by/4.0/
Abstract: PointGoal Navigation is an embodied task that requires agents to navigate to a specified point in an unseen environment. Wijmans et al. showed that this task is solvable but their method is computationally prohibitive, requiring 2.5 billion frames and 180 GPU-days. In this work, we develop a method to significantly increase sample and time efficiency in learning PointNav using self-supervised auxiliary tasks (e.g. predicting the action taken between two egocentric observations, predicting the distance between two observations from a trajectory,etc.).We find that naively combining multiple auxiliary tasks improves sample efficiency,but only provides marginal gains beyond a point. To overcome this, we use attention to combine representations learnt from individual auxiliary tasks. Our best agent is 5.5x faster to reach the performance of the previous state-of-the-art, DD-PPO, at 40M frames, and improves on DD-PPO's performance at 40M frames by 0.16 SPL. Our code is publicly available at https://github.com/joel99/habitat-pointnav-aux.
Abstract（参考訳）: pointgoal navigationは、エージェントが見えない環境で特定のポイントにナビゲートする必要がある、具体化されたタスクである。 Wijmansらは、このタスクは解決可能であるが、その方法は計算的に禁止されており、25億フレームと180GPU日を必要とすることを示した。本研究では,自己教師付き補助タスクを用いたポイントnav学習におけるサンプルと時間効率を著しく向上させる手法(例えば,2つの自己中心的観測間の動作を予測し,2つの観測間の距離を軌道から予測するなど)を開発した。複数の補助的タスクを鼻で組み合わせることで、サンプル効率が向上するが、1点以上の利得しか得られない。これを解決するために、個々の補助タスクから学習した表現を組み合わせるために注意を払っています。我々のベストエージェントは従来のDD-PPOを40Mフレームで5.5倍高速化し、DD-PPOの性能を0.16SPLで向上させる。私たちのコードはhttps://github.com/joel99/habitat-pointnav-auxで公開されています。

関連論文リスト

Co-SemDepth: Fast Joint Semantic Segmentation and Depth Estimation on Aerial Images [0.9883261192383611]
本稿では,空飛ぶロボットの単眼カメラを用いて,非構造環境における深度とセマンティックマップの予測を行う。本稿では,2つのタスクを正確かつ迅速に実行可能な共同ディープラーニングアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-03-23T08:25:07Z)
Token Cropr: Faster ViTs for Quite a Few Tasks [12.97062850155708]
本稿では,タスク関連性に基づいてトークンをエンドツーエンドに選択する方法を学習する補助予測ヘッドを用いたトークンプルーナを提案する。画像分類,セマンティックセグメンテーション,オブジェクト検出,インスタンスセグメンテーションについて評価し,1.5～4倍の性能低下を示す。
論文参考訳（メタデータ） (2024-12-01T20:58:29Z)
Memory Proxy Maps for Visual Navigation [6.1190419149081245]
視覚的なナビゲーションは人間からインスピレーションを受け、視覚を使って、詳細な環境マップを使わずに、これまで見えなかった環境をナビゲートする。これに触発されて、封建的学習を用いた視覚ナビゲーションのための、No-RL、No-graph、No-odometryアプローチを導入し、3つのタイレッドエージェントを構築した。
論文参考訳（メタデータ） (2024-11-15T02:37:14Z)
MPVO: Motion-Prior based Visual Odometry for PointGoal Navigation [3.9974562667271507]
視覚計測(VO)は,室内環境におけるエンボディエージェントの正確なポイントゴールナビゲーションを可能にするために不可欠である。近年の深層学習VO法は, 頑健な性能を示すが, トレーニング中のサンプル不効率に悩まされている。エージェントが環境をナビゲートしている間に利用可能な動作先に基づいて、ロバストでサンプル効率の良いVOパイプラインを提案する。
論文参考訳（メタデータ） (2024-11-07T15:36:49Z)
Visual Exemplar Driven Task-Prompting for Unified Perception in Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文参考訳（メタデータ） (2023-03-03T08:54:06Z)
DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文参考訳（メタデータ） (2022-09-07T00:35:27Z)
Waypoint Models for Instruction-guided Navigation in Continuous Environments [68.2912740006109]
本稿では,言語条件付きウェイポイント予測ネットワークのクラスを開発し,この問題について検討する。プロファイリングされたLoCoBotロボット上でのタスク性能と実行時間の推定を行う。我々のモデルは、VLN-CEにおける以前の仕事を上回り、新しい最先端の技術を公衆のリーダーボードに置きました。
論文参考訳（メタデータ） (2021-10-05T17:55:49Z)
Auxiliary Tasks and Exploration Enable ObjectNav [48.314102158070874]
補助学習タスクと探索報酬を追加することで,汎用学習エージェントを再生成する。われわれのエージェントは24.5%の成功、8.1%のSPL、それぞれ37%と8%の相対的な改善を達成している。
論文参考訳（メタデータ） (2021-04-08T23:03:21Z)
Work in Progress: Temporally Extended Auxiliary Tasks [13.605130745835638]
本稿では、時間差学習を用いて、政治上の予測を学習する補助的タスクについて考察する。我々は,VizDoom環境における時間差オートエンコーダ(TD-AE)のA2Cアルゴリズムへの影響を実験的に評価した。
論文参考訳（メタデータ） (2020-04-01T17:36:14Z)
Meta Reinforcement Learning with Autonomous Inference of Subtask Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文参考訳（メタデータ） (2020-01-01T17:34:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。