論文の概要: Navigating to Objects in the Real World
- arxiv url: http://arxiv.org/abs/2212.00922v1
- Date: Fri, 2 Dec 2022 01:10:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 16:32:52.010875
- Title: Navigating to Objects in the Real World
- Title(参考訳): 現実世界のオブジェクトにナビゲートする
- Authors: Theophile Gervet, Soumith Chintala, Dhruv Batra, Jitendra Malik,
Devendra Singh Chaplot
- Abstract要約: 本稿では,古典的,モジュール的,エンド・ツー・エンドの学習手法と比較した,意味的視覚ナビゲーション手法に関する大規模な実証的研究について述べる。
モジュラー学習は実世界ではうまく機能し、90%の成功率に達しています。
対照的に、エンド・ツー・エンドの学習は、シミュレーションと現実の間の画像領域の差が大きいため、77%のシミュレーションから23%の実際の成功率へと低下する。
- 参考スコア(独自算出の注目度): 76.1517654037993
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic navigation is necessary to deploy mobile robots in uncontrolled
environments like our homes, schools, and hospitals. Many learning-based
approaches have been proposed in response to the lack of semantic understanding
of the classical pipeline for spatial navigation, which builds a geometric map
using depth sensors and plans to reach point goals. Broadly, end-to-end
learning approaches reactively map sensor inputs to actions with deep neural
networks, while modular learning approaches enrich the classical pipeline with
learning-based semantic sensing and exploration. But learned visual navigation
policies have predominantly been evaluated in simulation. How well do different
classes of methods work on a robot? We present a large-scale empirical study of
semantic visual navigation methods comparing representative methods from
classical, modular, and end-to-end learning approaches across six homes with no
prior experience, maps, or instrumentation. We find that modular learning works
well in the real world, attaining a 90% success rate. In contrast, end-to-end
learning does not, dropping from 77% simulation to 23% real-world success rate
due to a large image domain gap between simulation and reality. For
practitioners, we show that modular learning is a reliable approach to navigate
to objects: modularity and abstraction in policy design enable Sim-to-Real
transfer. For researchers, we identify two key issues that prevent today's
simulators from being reliable evaluation benchmarks - (A) a large Sim-to-Real
gap in images and (B) a disconnect between simulation and real-world error
modes - and propose concrete steps forward.
- Abstract(参考訳): セマンティックナビゲーションは、私たちの家、学校、病院のような制御されていない環境にモバイルロボットを展開するために必要です。
深度センサを用いた幾何学的マップを構築し、点目標に到達する計画である空間ナビゲーションのための古典的なパイプラインの意味理解の欠如に応えて、多くの学習ベースのアプローチが提案されている。
広く、エンドツーエンドの学習アプローチはセンサ入力をディープニューラルネットワークによるアクションにリアクティブにマッピングする一方で、モジュール学習のアプローチは、学習に基づくセマンティックセンシングと探索による古典的なパイプラインを強化する。
しかし、学習した視覚ナビゲーションポリシーはシミュレーションで主に評価されている。
異なる方法のクラスがロボットでどの程度うまく機能するのか?
本研究では,従来経験のない6つの家庭を対象とした古典的,モジュール的,エンド・ツー・エンドの学習手法を比較し,意味的視覚ナビゲーション手法に関する大規模な実証的研究を行った。
モジュラー学習は実世界ではうまく機能し、90%の成功率に達しています。
対照的に、エンド・ツー・エンドの学習は、シミュレーションと現実の間の画像領域の差が大きいため、77%のシミュレーションから23%の実際の成功率へと低下する。
実践者にとって、モジュラー学習はオブジェクトへのナビゲートのための信頼性の高いアプローチであることを示す。
研究者のために、今日のシミュレータが信頼性の高い評価ベンチマークになることを妨げる2つの重要な問題、すなわち(a)画像のsim-to-realギャップと(b)シミュレーションと現実世界のエラーモードの切り離しを識別し、具体的なステップを提案する。
関連論文リスト
- Multi-Object Navigation in real environments using hybrid policies [18.52681391843433]
本稿では,問題を2つの異なるスキルに分解するハイブリッドナビゲーション手法を提案する。
シミュレーションと実環境の両方において、エンドツーエンドの手法と比較して、このアプローチの利点を示す。
論文 参考訳(メタデータ) (2024-01-24T20:41:25Z) - A Study on Learning Social Robot Navigation with Multimodal Perception [6.052803245103173]
本稿では,大規模実世界のデータセットを用いたマルチモーダル認識を用いた社会ロボットナビゲーションの学習について述べる。
我々は,一助学習と多モーダル学習のアプローチを,異なる社会シナリオにおける古典的なナビゲーション手法のセットと比較する。
その結果、マルチモーダル学習は、データセットと人的学習の両方において、一助学習よりも明らかな優位性を持つことが示された。
論文 参考訳(メタデータ) (2023-09-22T01:47:47Z) - Learning Navigational Visual Representations with Semantic Map
Supervision [85.91625020847358]
エージェントの自我中心のビューとセマンティックマップを対比してナビゲーション固有の視覚表現学習法を提案する。
Ego$2$-Map学習は、オブジェクト、構造、遷移などのコンパクトでリッチな情報を、ナビゲーションのためのエージェントのエゴセントリックな表現に転送する。
論文 参考訳(メタデータ) (2023-07-23T14:01:05Z) - Practical Imitation Learning in the Real World via Task Consistency Loss [18.827979446629296]
本稿では,機能レベルと行動予測レベルの両方において,シミュレートと実際のアライメントを促進する自己監督的損失を提案する。
我々は、シミュレートとリアルで遠隔操作されたデモンストレーションを16.2時間しか使っていない10のシーンで80%の成功を達成した。
論文 参考訳(メタデータ) (2022-02-03T21:43:06Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - ViNG: Learning Open-World Navigation with Visual Goals [82.84193221280216]
視覚的目標達成のための学習に基づくナビゲーションシステムを提案する。
提案手法は,我々がvingと呼ぶシステムが,目標条件強化学習のための提案手法を上回っていることを示す。
我々は、ラストマイル配送や倉庫検査など、現実の多くのアプリケーションでViNGを実演する。
論文 参考訳(メタデータ) (2020-12-17T18:22:32Z) - Visual Navigation Among Humans with Optimal Control as a Supervisor [72.5188978268463]
そこで本研究では,学習に基づく知覚とモデルに基づく最適制御を組み合わせることで,人間間をナビゲートする手法を提案する。
私たちのアプローチは、新しいデータ生成ツールであるHumANavによって実現されています。
学習したナビゲーションポリシーは、将来の人間の動きを明示的に予測することなく、人間に予測し、反応できることを実証する。
論文 参考訳(メタデータ) (2020-03-20T16:13:47Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。