論文の概要: Realistic PointGoal Navigation via Auxiliary Losses and Information
Bottleneck
- arxiv url: http://arxiv.org/abs/2109.08677v1
- Date: Fri, 17 Sep 2021 17:58:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-20 14:43:24.209005
- Title: Realistic PointGoal Navigation via Auxiliary Losses and Information
Bottleneck
- Title(参考訳): 補助損失と情報ボトルネックによるリアルなポイントゴーアナビゲーション
- Authors: Guillermo Grande, Dhruv Batra, Erik Wijmans
- Abstract要約: 本稿では,現実的なポイントゴールナビゲーションを訓練するための新しいアーキテクチャとトレーニングパラダイムを提案する。
理想的なローカライゼーションを取り除いた場合、エージェントはその目標に向かって確実に前進しているにもかかわらず、正確に停止することができない。
エージェントは,情報ボトルネックによるトレーニング中に,地中局地化読解に制限されたアクセスを許可する。
- 参考スコア(独自算出の注目度): 42.15905448139498
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel architecture and training paradigm for training realistic
PointGoal Navigation -- navigating to a target coordinate in an unseen
environment under actuation and sensor noise without access to ground-truth
localization. Specifically, we find that the primary challenge under this
setting is learning localization -- when stripped of idealized localization,
agents fail to stop precisely at the goal despite reliably making progress
towards it. To address this we introduce a set of auxiliary losses to help the
agent learn localization. Further, we explore the idea of treating the precise
location of the agent as privileged information -- it is unavailable during
test time, however, it is available during training time in simulation. We
grant the agent restricted access to ground-truth localization readings during
training via an information bottleneck. Under this setting, the agent incurs a
penalty for using this privileged information, encouraging the agent to only
leverage this information when it is crucial to learning. This enables the
agent to first learn navigation and then learn localization instead of
conflating these two objectives in training. We evaluate our proposed method
both in a semi-idealized (noiseless simulation without Compass+GPS) and
realistic (addition of noisy simulation) settings. Specifically, our method
outperforms existing baselines on the semi-idealized setting by 18\%/21\%
SPL/Success and by 15\%/20\% SPL in the realistic setting. Our improved Success
and SPL metrics indicate our agent's improved ability to accurately
self-localize while maintaining a strong navigation policy. Our implementation
can be found at https://github.com/NicoGrande/habitat-pointnav-via-ib.
- Abstract(参考訳): 本研究は, 地対地定位へのアクセスを必要とせず, 作動・センサノイズ下で, 目立たない環境下で目標座標にナビゲートする, 現実的なポイントゴーアナビゲーションを訓練するための新しいアーキテクチャとトレーニングパラダイムを提案する。
Specifically, we find that the primary challenge under this setting is learning localization -- when stripped of idealized localization, agents fail to stop precisely at the goal despite reliably making progress towards it. To address this we introduce a set of auxiliary losses to help the agent learn localization. Further, we explore the idea of treating the precise location of the agent as privileged information -- it is unavailable during test time, however, it is available during training time in simulation.
エージェントは,情報ボトルネックを介し,訓練中に地中ローカライズリーディングへのアクセスを制限した。
この設定下では、エージェントは、この特権情報を使用するためのペナルティを負い、学習に不可欠である場合にのみ、この情報を活用するようエージェントに促す。
これにより、エージェントはまずナビゲーションを学習し、トレーニングでこれらの2つの目的を混同するのではなく、ローカライゼーションを学ぶことができる。
提案手法は,半理想化(コンパス+gpsを伴わない無ノイズシミュレーション)と現実的な(ノイズシミュレーションの追加)の両方で評価する。
具体的には、半理想化設定における既存ベースラインを18\%/21\%spl/success、現実設定で15\%/20\%splで上回る。
改良されたSuccessとSPLメトリクスは、強力なナビゲーションポリシーを維持しながら、エージェントが正確に自己ローカライズする能力の向上を示している。
実装はhttps://github.com/NicoGrande/habitat-pointnav-via-ibで確認できます。
関連論文リスト
- NavCoT: Boosting LLM-Based Vision-and-Language Navigation via Learning
Disentangled Reasoning [101.56342075720588]
Embodied AIの重要な研究課題であるVision-and-Language Navigation (VLN)は、自然言語の指示に従って複雑な3D環境をナビゲートするために、エンボディエージェントを必要とする。
近年の研究では、ナビゲーションの推論精度と解釈可能性を改善することにより、VLNにおける大きな言語モデル(LLM)の有望な能力を強調している。
本稿では,自己誘導型ナビゲーション決定を実現するために,パラメータ効率の高いドメイン内トレーニングを実現する,Navigational Chain-of-Thought (NavCoT) という新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-03-12T07:27:02Z) - Deep Reinforcement Learning for Localizability-Enhanced Navigation in
Dynamic Human Environments [16.25625435648576]
自律ロボットにとって、信頼性の高いローカライゼーションは、効率的かつ安全にナビゲートすることが不可欠である。
深部強化学習による局所化可能性向上ナビゲーションのための新しい手法を提案する。
従来は見られなかった環境下では, 損失率と到着率に大きな改善が見られた。
論文 参考訳(メタデータ) (2023-03-22T07:44:35Z) - Unsupervised Visual Odometry and Action Integration for PointGoal
Navigation in Indoor Environment [14.363948775085534]
屋内環境におけるポイントゴールナビゲーションは、個人ロボットが特定の地点に向かうための基本的なタスクである。
GPS信号を使わずにPointGoalナビゲーションの精度を向上させるために、ビジュアル・オドメトリー(VO)を用い、教師なしで訓練された新しいアクション統合モジュール(AIM)を提案する。
実験により,提案システムは良好な結果が得られ,Gibsonデータセット上で部分的に教師付き学習アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-10-02T03:12:03Z) - Generalization in Deep Reinforcement Learning for Robotic Navigation by
Reward Shaping [0.1588748438612071]
ローカルナビゲーション問題におけるDRLアルゴリズムの適用について検討する。
DRLに基づく衝突回避ポリシーにはいくつかの利点があるが、それらは局所的なミニマの影響を受けやすい。
本稿では,学習段階において得られた地図情報を取り入れた新たな報酬関数を提案する。
論文 参考訳(メタデータ) (2022-09-28T17:34:48Z) - Using Deep Reinforcement Learning with Automatic Curriculum earning for
Mapless Navigation in Intralogistics [0.7633618497843278]
本稿では,倉庫シナリオにおけるマップレスナビゲーション問題を解決するための深層強化学習手法を提案する。
自動誘導車両は、LiDARと前頭RGBセンサーを備え、目標のドームの下に到達することを学ぶ。
NavACL-Qは、学習プロセス全体を大幅に促進し、事前訓練された特徴抽出器は、トレーニング速度を顕著に向上させる。
論文 参考訳(メタデータ) (2022-02-23T13:50:01Z) - LocUNet: Fast Urban Positioning Using Radio Maps and Deep Learning [59.17191114000146]
LocUNet: 基地局(BSs)からの受信信号強度(RSS)のみに基づく深層学習手法
提案手法では,BSsからのRSSを,クラウド上に存在する可能性のある中央処理ユニット(CPU)にローカライズする。
推定されたBSのパスロスラジオマップを用いて、LocUNetは最先端の精度でユーザをローカライズし、無線マップの不正確性に対して高い堅牢性を享受する。
論文 参考訳(メタデータ) (2022-02-01T20:27:46Z) - Language-guided Navigation via Cross-Modal Grounding and Alternate
Adversarial Learning [66.9937776799536]
新たなビジョン・アンド・ランゲージナビゲーション(VLN)問題は、見えない写真リアリスティック環境において、エージェントがターゲットの場所に向かうことを学習することを目的としている。
VLNの主な課題は、主に2つの側面から生じている: まず、エージェントは動的に変化する視覚環境に対応する言語命令の有意義な段落に出席する必要がある。
そこで本稿では,エージェントにテキストと視覚の対応性を追跡する機能を持たせるために,クロスモーダルグラウンドモジュールを提案する。
論文 参考訳(メタデータ) (2020-11-22T09:13:46Z) - Embodied Visual Navigation with Automatic Curriculum Learning in Real
Environments [20.017277077448924]
NavACLは、ナビゲーションタスクに適した自動カリキュラム学習の方法である。
NavACLを用いて訓練した深層強化学習剤は、均一サンプリングで訓練した最先端エージェントよりも有意に優れていた。
我々のエージェントは、未知の乱雑な屋内環境から、RGB画像のみを使用して意味的に特定されたターゲットへ移動することができる。
論文 参考訳(メタデータ) (2020-09-11T13:28:26Z) - Integrating Egocentric Localization for More Realistic Point-Goal
Navigation Agents [90.65480527538723]
本研究では,ノイズ行動力学の下での自我行動の視覚的推定に依存するポイントゴールナビゲーションエージェントを開発した。
私たちのエージェントはCVPR 2020 Habitat ChallengeのPointNavトラックのランナーでした。
論文 参考訳(メタデータ) (2020-09-07T16:52:47Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。