論文の概要: Building Intelligent Autonomous Navigation Agents
- arxiv url: http://arxiv.org/abs/2106.13415v1
- Date: Fri, 25 Jun 2021 04:10:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-28 23:09:36.407268
- Title: Building Intelligent Autonomous Navigation Agents
- Title(参考訳): インテリジェントな自律ナビゲーションエージェントの構築
- Authors: Devendra Singh Chaplot
- Abstract要約: この論文の目標は、物理的な知能を持つアルゴリズムの設計に向けて前進することである」。
論文の前半では、エンドツーエンドの強化学習を用いた短期ナビゲーションについて論じる。
第2部では,モジュール型学習と構造化された明示的地図表現に基づくナビゲーション手法について述べる。
- 参考スコア(独自算出の注目度): 18.310643564200525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Breakthroughs in machine learning in the last decade have led to `digital
intelligence', i.e. machine learning models capable of learning from vast
amounts of labeled data to perform several digital tasks such as speech
recognition, face recognition, machine translation and so on. The goal of this
thesis is to make progress towards designing algorithms capable of `physical
intelligence', i.e. building intelligent autonomous navigation agents capable
of learning to perform complex navigation tasks in the physical world involving
visual perception, natural language understanding, reasoning, planning, and
sequential decision making. Despite several advances in classical navigation
methods in the last few decades, current navigation agents struggle at
long-term semantic navigation tasks. In the first part of the thesis, we
discuss our work on short-term navigation using end-to-end reinforcement
learning to tackle challenges such as obstacle avoidance, semantic perception,
language grounding, and reasoning. In the second part, we present a new class
of navigation methods based on modular learning and structured explicit map
representations, which leverage the strengths of both classical and end-to-end
learning methods, to tackle long-term navigation tasks. We show that these
methods are able to effectively tackle challenges such as localization,
mapping, long-term planning, exploration and learning semantic priors. These
modular learning methods are capable of long-term spatial and semantic
understanding and achieve state-of-the-art results on various navigation tasks.
- Abstract(参考訳): 過去10年間の機械学習のブレークスルーは‘デジタルインテリジェンス’、すなわち“デジタルインテリジェンス’につながった。
膨大なラベル付きデータから学習し、音声認識、顔認識、機械翻訳などのデジタルタスクを実行することができる機械学習モデル。
この論文の目標は「物理知性」が可能なアルゴリズムの設計を前進させることである。
視覚知覚、自然言語理解、推論、計画、シーケンシャルな意思決定を含む、物理的な世界で複雑なナビゲーションタスクを実行できるインテリジェントな自律ナビゲーションエージェントの構築。
過去数十年間の古典的ナビゲーション手法の進歩にもかかわらず、現在のナビゲーションエージェントは長期的な意味的ナビゲーションタスクで苦労している。
論文の前半では,障害回避,意味認識,言語接地,推論といった課題に取り組むために,エンドツーエンドの強化学習を用いた短期ナビゲーションについて論じる。
第2部では,モジュール型学習と構造化された明示的地図表現に基づく新しいナビゲーション手法について紹介する。
これらの手法は, ローカライゼーション, マッピング, 長期計画, 探索, セマンティック事前学習といった課題に効果的に対処できることを示す。
これらのモジュール型学習手法は,長期的空間的・意味的理解と,様々なナビゲーションタスクにおける最先端の成果を達成することができる。
関連論文リスト
- MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains [4.941781282578696]
Vision-and-Language Navigation (VLN)タスクでは、エージェントは自然言語の指示に従って目的地に向かう必要がある。
学習ベースのアプローチはタスクに対する主要な解決策だが、高いトレーニングコストと解釈可能性の欠如に悩まされている。
近年、Large Language Models (LLMs) は強力な一般化能力のため、VLNにとって有望なツールとして登場した。
論文 参考訳(メタデータ) (2024-05-17T08:33:27Z) - Learning Navigational Visual Representations with Semantic Map
Supervision [85.91625020847358]
エージェントの自我中心のビューとセマンティックマップを対比してナビゲーション固有の視覚表現学習法を提案する。
Ego$2$-Map学習は、オブジェクト、構造、遷移などのコンパクトでリッチな情報を、ナビゲーションのためのエージェントのエゴセントリックな表現に転送する。
論文 参考訳(メタデータ) (2023-07-23T14:01:05Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - Recent Advancements in Deep Learning Applications and Methods for
Autonomous Navigation: A Comprehensive Review [0.0]
レビュー記事は、主要な機能を扱うために使用される、最近のAIベースのテクニックをすべて調査する試みである。
Paperは、自律的なナビゲーションとディープラーニングのギャップを埋めることを目指している。
論文 参考訳(メタデータ) (2023-02-22T01:42:49Z) - Learning Robotic Navigation from Experience: Principles, Methods, and
Recent Results [94.60414567852536]
現実世界のナビゲーションは、単純な幾何学的抽象化に反する複雑な物理的課題の集合を示す。
機械学習は、幾何学や従来の計画を超えた、有望な方法を提供する。
本稿では,ロボットナビゲーションスキルを実験的に学習するツールキットについて紹介する。
論文 参考訳(メタデータ) (2022-12-13T17:41:58Z) - Navigating to Objects in the Real World [76.1517654037993]
本稿では,古典的,モジュール的,エンド・ツー・エンドの学習手法と比較した,意味的視覚ナビゲーション手法に関する大規模な実証的研究について述べる。
モジュラー学習は実世界ではうまく機能し、90%の成功率に達しています。
対照的に、エンド・ツー・エンドの学習は、シミュレーションと現実の間の画像領域の差が大きいため、77%のシミュレーションから23%の実際の成功率へと低下する。
論文 参考訳(メタデータ) (2022-12-02T01:10:47Z) - PONI: Potential Functions for ObjectGoal Navigation with
Interaction-free Learning [125.22462763376993]
対話自由学習(PONI)を用いたオブジェクト指向ナビゲーションの可能性について提案する。
PONIは、物がどこに見えるかというスキルと、どのように(x, y)にナビゲートするかを歪めます。」
論文 参考訳(メタデータ) (2022-01-25T01:07:32Z) - Deep Learning for Embodied Vision Navigation: A Survey [108.13766213265069]
身体的視覚ナビゲーション」問題では、エージェントが3D環境をナビゲートする必要がある。
本稿では、総合的な文献調査を提供することで、視覚ナビゲーションの具体的分野における現在の研究の概要を確立することを試みる。
論文 参考訳(メタデータ) (2021-07-07T12:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。