論文の概要: Learning Synthetic to Real Transfer for Localization and Navigational
Tasks
- arxiv url: http://arxiv.org/abs/2011.10274v2
- Date: Mon, 23 Nov 2020 16:43:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 05:30:39.889583
- Title: Learning Synthetic to Real Transfer for Localization and Navigational
Tasks
- Title(参考訳): ローカライゼーションとナビゲーションタスクのためのリアルトランスファーへの学習
- Authors: Maxime Pietrantoni, Boris Chidlovskii, Tomi Silander
- Abstract要約: ナビゲーションは、コンピュータビジョン、ロボット工学、制御の概念を組み合わせて、複数の分野のクロスロードにある。
この研究は、実世界への移動をできる限り少ない努力で行うことができるナビゲーションパイプラインをシミュレーションで作成することを目的としていた。
ナビゲーションパイプラインを設計するには、環境、ローカライゼーション、ナビゲーション、計画の4つの大きな課題が発生する。
- 参考スコア(独自算出の注目度): 7.019683407682642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous navigation consists in an agent being able to navigate without
human intervention or supervision, it affects both high level planning and low
level control. Navigation is at the crossroad of multiple disciplines, it
combines notions of computer vision, robotics and control. This work aimed at
creating, in a simulation, a navigation pipeline whose transfer to the real
world could be done with as few efforts as possible. Given the limited time and
the wide range of problematic to be tackled, absolute navigation performances
while important was not the main objective. The emphasis was rather put on
studying the sim2real gap which is one the major bottlenecks of modern robotics
and autonomous navigation. To design the navigation pipeline four main
challenges arise; environment, localization, navigation and planning. The
iGibson simulator is picked for its photo-realistic textures and physics
engine. A topological approach to tackle space representation was picked over
metric approaches because they generalize better to new environments and are
less sensitive to change of conditions. The navigation pipeline is decomposed
as a localization module, a planning module and a local navigation module.
These modules utilize three different networks, an image representation
extractor, a passage detector and a local policy. The laters are trained on
specifically tailored tasks with some associated datasets created for those
specific tasks. Localization is the ability for the agent to localize itself
against a specific space representation. It must be reliable, repeatable and
robust to a wide variety of transformations. Localization is tackled as an
image retrieval task using a deep neural network trained on an auxiliary task
as a feature descriptor extractor. The local policy is trained with behavioral
cloning from expert trajectories gathered with ROS navigation stack.
- Abstract(参考訳): 自律ナビゲーションは、人間の介入や監督なしにナビゲートできるエージェントで構成されており、高いレベルの計画と低レベルの制御の両方に影響を与える。
ナビゲーションは、コンピュータビジョン、ロボット工学、制御の概念を組み合わせて、複数の分野のクロスロードにある。
この研究は、実世界への移動をできる限り少ない努力で行うことができるナビゲーションパイプラインをシミュレーションで作成することを目的としていた。
限られた時間と幅広い問題を考えると、重要なものの絶対的なナビゲーション性能が主な目的ではなかった。
むしろ、現代のロボット工学と自律ナビゲーションの大きなボトルネックであるsim2realギャップの研究に重点が置かれた。
ナビゲーションパイプラインを設計するには、環境、ローカライゼーション、ナビゲーション、計画の4つの大きな課題が発生する。
igibson simulatorは、フォトリアリスティックなテクスチャと物理エンジンで選ばれた。
空間表現に取り組むトポロジカルなアプローチは、新しい環境への一般化と条件の変化に対する感受性の低下から、計量的アプローチよりも選択された。
ナビゲーションパイプラインは、ローカライゼーションモジュール、プランニングモジュール、ローカルナビゲーションモジュールとして分解される。
これらのモジュールは3つの異なるネットワーク、画像表現抽出器、通過検出器、局所ポリシーを利用する。
後者は、特定のタスク用に作成された関連するデータセットを使用して、特別に調整されたタスクでトレーニングされる。
局所化は、エージェントが特定の空間表現に対して局所化する能力である。
さまざまな変換に対して,信頼性と再現性,堅牢性が求められます。
特徴記述子抽出器として補助タスクで訓練されたディープニューラルネットワークを用いて、画像検索タスクとしてローカライゼーションに取り組む。
ローカルポリシーは、ROSナビゲーションスタックで収集された専門家の軌道からの行動的クローンによって訓練される。
関連論文リスト
- Vision and Language Navigation in the Real World via Online Visual
Language Mapping [18.769171505280127]
視覚・言語ナビゲーション(VLN)法は主にシミュレーションで評価される。
実世界のVLN課題に対処する新しい枠組みを提案する。
未確認実験環境において,Interbotix LoCoBot WX250を用いたパイプラインの評価を行った。
論文 参考訳(メタデータ) (2023-10-16T20:44:09Z) - Learning Navigational Visual Representations with Semantic Map
Supervision [85.91625020847358]
エージェントの自我中心のビューとセマンティックマップを対比してナビゲーション固有の視覚表現学習法を提案する。
Ego$2$-Map学習は、オブジェクト、構造、遷移などのコンパクトでリッチな情報を、ナビゲーションのためのエージェントのエゴセントリックな表現に転送する。
論文 参考訳(メタデータ) (2023-07-23T14:01:05Z) - ETPNav: Evolving Topological Planning for Vision-Language Navigation in
Continuous Environments [56.194988818341976]
視覚言語ナビゲーションは、エージェントが環境中をナビゲートするための指示に従う必要があるタスクである。
本研究では,1)環境を抽象化し,長距離航法計画を生成する能力,2)連続環境における障害物回避制御能力の2つの重要なスキルに焦点を当てたETPNavを提案する。
ETPNavは、R2R-CEとRxR-CEデータセットの先行技術よりも10%以上、20%改善されている。
論文 参考訳(メタデータ) (2023-04-06T13:07:17Z) - Image-based Navigation in Real-World Environments via Multiple Mid-level
Representations: Fusion Models, Benchmark and Efficient Evaluation [13.207579081178716]
近年の学習に基づくナビゲーション手法では,エージェントのシーン理解とナビゲーション能力が同時に実現されている。
残念ながら、シミュレーターがナビゲーションポリシーを訓練する効率的なツールであるとしても、現実の世界に移動すると、結果のモデルは失敗することが多い。
可能な解決策の1つは、シーンの重要なドメイン不変性を含む中間レベルの視覚表現を備えたナビゲーションモデルを提供することである。
論文 参考訳(メタデータ) (2022-02-02T15:00:44Z) - Structured Scene Memory for Vision-Language Navigation [155.63025602722712]
視覚言語ナビゲーション(VLN)のための重要なアーキテクチャを提案する。
ナビゲーション中に知覚を正確に記憶できるほど区画化されている。
また、環境内の視覚的および幾何学的な手がかりを捉え、取り除く、構造化されたシーン表現としても機能する。
論文 参考訳(メタデータ) (2021-03-05T03:41:00Z) - MultiON: Benchmarking Semantic Map Memory using Multi-Object Navigation [23.877609358505268]
最近の研究は、地図のようなメモリが長距離ナビゲーションタスクに有用であることを示している。
本稿では,実環境において,エピソード特有のオブジェクト列へのナビゲーションを必要とするマルチオンタスクを提案する。
様々なエージェントモデルがナビゲーションタスクの複雑度をまたいでどのように振る舞うかを検討する。
論文 参考訳(メタデータ) (2020-12-07T18:42:38Z) - Unsupervised Domain Adaptation for Visual Navigation [115.85181329193092]
視覚ナビゲーションのための教師なし領域適応手法を提案する。
本手法では,対象領域の画像をソース領域に変換し,ナビゲーションポリシで学習した表現と一致するようにする。
論文 参考訳(メタデータ) (2020-10-27T18:22:43Z) - Embodied Visual Navigation with Automatic Curriculum Learning in Real
Environments [20.017277077448924]
NavACLは、ナビゲーションタスクに適した自動カリキュラム学習の方法である。
NavACLを用いて訓練した深層強化学習剤は、均一サンプリングで訓練した最先端エージェントよりも有意に優れていた。
我々のエージェントは、未知の乱雑な屋内環境から、RGB画像のみを使用して意味的に特定されたターゲットへ移動することができる。
論文 参考訳(メタデータ) (2020-09-11T13:28:26Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。