論文の概要: Neural Topological SLAM for Visual Navigation
- arxiv url: http://arxiv.org/abs/2005.12256v2
- Date: Thu, 28 May 2020 22:56:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 05:11:40.280230
- Title: Neural Topological SLAM for Visual Navigation
- Title(参考訳): 視覚ナビゲーションのためのニューラルトポロジカルSLAM
- Authors: Devendra Singh Chaplot, Ruslan Salakhutdinov, Abhinav Gupta, Saurabh
Gupta
- Abstract要約: 意味論を生かし、近似幾何学的推論を行う空間のトポロジ的表現を設計する。
本稿では,ノイズのあるアクティベーションの下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
- 参考スコア(独自算出の注目度): 112.73876869904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the problem of image-goal navigation which involves
navigating to the location indicated by a goal image in a novel previously
unseen environment. To tackle this problem, we design topological
representations for space that effectively leverage semantics and afford
approximate geometric reasoning. At the heart of our representations are nodes
with associated semantic features, that are interconnected using coarse
geometric information. We describe supervised learning-based algorithms that
can build, maintain and use such representations under noisy actuation.
Experimental study in visually and physically realistic simulation suggests
that our method builds effective representations that capture structural
regularities and efficiently solve long-horizon navigation problems. We observe
a relative improvement of more than 50% over existing methods that study this
task.
- Abstract(参考訳): そこで本稿では,これまで見つからなかった新しい環境において,目標画像が示す位置をナビゲートするという課題について検討する。
この問題に取り組むため,我々は意味論を効果的に活用し,近似幾何学的推論を可能にする空間の位相表現を設計する。
私たちの表現の中心は、粗い幾何学的情報を使って相互に繋がる、関連する意味的特徴を持つノードです。
ノイズの多い動作下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
視覚的および身体的現実的なシミュレーション実験により,本手法は構造的規則性を捕捉し,長距離航法問題を効率的に解決する効果的な表現を構築することが示唆された。
この課題を研究対象とする既存手法に比べて50%以上の相対的な改善が見られた。
関連論文リスト
- Graphical Object-Centric Actor-Critic [55.2480439325792]
本稿では,アクター批判とモデルに基づくアプローチを組み合わせたオブジェクト中心強化学習アルゴリズムを提案する。
変換器エンコーダを用いてオブジェクト表現とグラフニューラルネットワークを抽出し、環境のダイナミクスを近似する。
本アルゴリズムは,現状のモデルフリーアクター批判アルゴリズムよりも複雑な3次元ロボット環境と構成構造をもつ2次元環境において,より優れた性能を発揮する。
論文 参考訳(メタデータ) (2023-10-26T06:05:12Z) - Learning Navigational Visual Representations with Semantic Map
Supervision [85.91625020847358]
エージェントの自我中心のビューとセマンティックマップを対比してナビゲーション固有の視覚表現学習法を提案する。
Ego$2$-Map学習は、オブジェクト、構造、遷移などのコンパクトでリッチな情報を、ナビゲーションのためのエージェントのエゴセントリックな表現に転送する。
論文 参考訳(メタデータ) (2023-07-23T14:01:05Z) - How To Not Train Your Dragon: Training-free Embodied Object Goal
Navigation with Semantic Frontiers [94.46825166907831]
Embodied AIにおけるオブジェクトゴールナビゲーション問題に対処するためのトレーニング不要のソリューションを提案する。
本手法は,古典的な視覚的同時ローカライゼーションとマッピング(V-SLAM)フレームワークに基づく,構造化されたシーン表現を構築する。
本手法は,言語先行情報とシーン統計に基づいてシーングラフのセマンティクスを伝搬し,幾何学的フロンティアに意味知識を導入する。
論文 参考訳(メタデータ) (2023-05-26T13:38:33Z) - Spatio-Temporal Relation Learning for Video Anomaly Detection [35.59510027883497]
異常識別は、オブジェクトとシーンの関係に大きく依存する。
本稿では,ビデオ異常検出タスクに対処するための空間時間関係学習フレームワークを提案する。
3つの公開データセットで実験を行い、最先端手法よりも優れた性能を示し、本手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-09-27T02:19:31Z) - An explainability framework for cortical surface-based deep learning [110.83289076967895]
我々は,皮質表面の深層学習のためのフレームワークを開発した。
まず,表面データに摂動に基づくアプローチを適用した。
我々の説明可能性フレームワークは,重要な特徴とその空間的位置を識別できるだけでなく,信頼性と有効性も示している。
論文 参考訳(メタデータ) (2022-03-15T23:16:49Z) - MaAST: Map Attention with Semantic Transformersfor Efficient Visual
Navigation [4.127128889779478]
この作業は、自律エージェントの視覚ナビゲーションのための既存の学習ベースのソリューションよりも良く、または匹敵するパフォーマンスに重点を置いています。
本稿では,重要シーンのセマンティクスを意味的に理解し,トップダウンのエゴセントリックな地図表現にエンコードする手法を提案する。
本研究では,3次元再構成した屋内ポイントゴーア視覚ナビゲーション実験を行い,その効果を実証する。
論文 参考訳(メタデータ) (2021-03-21T12:01:23Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。