論文の概要: Markov Localisation using Heatmap Regression and Deep Convolutional
Odometry
- arxiv url: http://arxiv.org/abs/2106.00371v1
- Date: Tue, 1 Jun 2021 10:28:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-02 14:29:59.916541
- Title: Markov Localisation using Heatmap Regression and Deep Convolutional
Odometry
- Title(参考訳): ヒートマップ回帰と深い畳み込みオドメトリを用いたマルコフ局所化
- Authors: Oscar Mendez, Simon Hadfield, Richard Bowden
- Abstract要約: 我々は,最新のディープラーニングハードウェアを活用する新しいCNNベースのローカライゼーション手法を提案する。
画像に基づくローカライゼーションと,1つのニューラルネットワーク内でのオドメトリーに基づく確率伝搬を行うハイブリッドCNNを作成する。
- 参考スコア(独自算出の注目度): 59.33322623437816
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of self-driving vehicles there is strong competition between
approaches based on visual localisation and LiDAR. While LiDAR provides
important depth information, it is sparse in resolution and expensive. On the
other hand, cameras are low-cost and recent developments in deep learning mean
they can provide high localisation performance. However, several fundamental
problems remain, particularly in the domain of uncertainty, where learning
based approaches can be notoriously over-confident.
Markov, or grid-based, localisation was an early solution to the localisation
problem but fell out of favour due to its computational complexity.
Representing the likelihood field as a grid (or volume) means there is a trade
off between accuracy and memory size. Furthermore, it is necessary to perform
expensive convolutions across the entire likelihood volume. Despite the benefit
of simultaneously maintaining a likelihood for all possible locations, grid
based approaches were superseded by more efficient particle filters and Monte
Carlo Localisation (MCL). However, MCL introduces its own problems e.g.
particle deprivation.
Recent advances in deep learning hardware allow large likelihood volumes to
be stored directly on the GPU, along with the hardware necessary to efficiently
perform GPU-bound 3D convolutions and this obviates many of the disadvantages
of grid based methods. In this work, we present a novel CNN-based localisation
approach that can leverage modern deep learning hardware. By implementing a
grid-based Markov localisation approach directly on the GPU, we create a hybrid
CNN that can perform image-based localisation and odometry-based likelihood
propagation within a single neural network. The resulting approach is capable
of outperforming direct pose regression methods as well as state-of-the-art
localisation systems.
- Abstract(参考訳): 自動運転車の文脈では、視覚的ローカライゼーションに基づくアプローチとLiDARとの強い競争がある。
LiDARは重要な深度情報を提供するが、解像度が低く高価である。
一方、カメラは低コストであり、ディープラーニングの最近の進歩は、高いローカライズ性能を提供できることを意味する。
しかし、特に不確実性領域において、学習に基づくアプローチが自信過剰で悪名高い、いくつかの根本的な問題が残っている。
マルコフ、あるいはグリッドベースのローカライズは、ローカライズ問題の初期の解決策であったが、計算の複雑さのために好ましくなかった。
確率場をグリッド(またはボリューム)として表現することは、精度とメモリサイズの間にトレードオフがあることを意味する。
さらに,全容積全体にわたって高価な畳み込みを行う必要がある。
全ての可能な位置を同時に維持する利点にもかかわらず、グリッドベースのアプローチはより効率的な粒子フィルタとモンテカルロ局在(MCL)に取って代わられた。
しかし、MCLは独自の問題を導入している。
粒子除去
近年のディープラーニングハードウェアの進歩により、GPUに格納される大きな可能性ボリュームと、GPUによる3D畳み込みを効率的に実行するために必要なハードウェアが実現し、グリッドベースの手法の欠点の多くを排除している。
本研究では,最新のディープラーニングハードウェアを活用する新しいCNNベースのローカライゼーション手法を提案する。
グリッドベースのマルコフローカライズアプローチをgpu上で直接実装することにより、単一のニューラルネットワーク内でイメージベースのローカライズとオドメトリーに基づくラピッド伝搬を実行できるハイブリッドcnnを作成する。
結果として得られたアプローチは、最先端のローカライズシステムと同様に、直接ポーズ回帰法を上回ることができる。
関連論文リスト
- MapLocNet: Coarse-to-Fine Feature Registration for Visual Re-Localization in Navigation Maps [8.373285397029884]
伝統的なローカライゼーションアプローチは、正確に注釈付けされたランドマークからなる高定義(HD)マップに依存している。
本稿では,画像登録にインスパイアされたトランスフォーマーを用いたニューラルリローカライズ手法を提案する。
提案手法は, nuScenes と Argoverse の両方のデータセット上で, 現在最先端の OrienterNet を著しく上回っている。
論文 参考訳(メタデータ) (2024-07-11T14:51:18Z) - GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Towards Compact 3D Representations via Point Feature Enhancement Masked
Autoencoders [52.66195794216989]
本稿では,コンパクトな3D表現を学習するために,ポイント特徴強調マスク付きオートエンコーダ(Point-FEMAE)を提案する。
Point-FEMAEはグローバルブランチとローカルブランチで構成され、潜在意味的特徴をキャプチャする。
本手法は, クロスモーダル方式と比較して, 事前学習効率を著しく向上させる。
論文 参考訳(メタデータ) (2023-12-17T14:17:05Z) - Weakly Supervised Object Localization via Transformer with Implicit
Spatial Calibration [20.322494442959762]
Wakly Supervised Object Localization (WSOL) は、実際のアプリケーションでアノテーションのコストが低いため、多くの注目を集めている。
パッチトークンとそれらの空間関係のセマンティックな類似性を統合拡散モデルに組み込んだ,正確なWSOLのためのシンプルで効果的な空間モジュール(SCM)を提案する。
SCMはTransformerの外部モジュールとして設計されており、推論中に除去して計算コストを削減することができる。
論文 参考訳(メタデータ) (2022-07-21T12:37:15Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z) - Focus on Local: Detecting Lane Marker from Bottom Up via Key Point [10.617793053931964]
本研究では,局所パターンのモデル化とグローバルな構造予測に焦点をあてた新しいレーンマーカー検出ソリューションFOLOLaneを提案する。
具体的には、CNNは2つの異なる頭部を持つ低複雑局所パターンをモデル化し、第1は鍵点の存在を予測し、第2は局所範囲における鍵点の位置を洗練し、同じレーン線の鍵点を相関させる。
論文 参考訳(メタデータ) (2021-05-28T08:59:14Z) - Zero-Shot Multi-View Indoor Localization via Graph Location Networks [66.05980368549928]
屋内ローカライゼーションは、位置ベースアプリケーションにおける基本的な問題である。
本稿では,インフラストラクチャフリーで多視点画像に基づく屋内ローカライゼーションを実現するために,新しいニューラルネットワークアーキテクチャであるGraph Location Networks(GLN)を提案する。
GLNは、メッセージパッシングネットワークを通じて画像から抽出されたロバストな位置表現に基づいて位置予測を行う。
新たにゼロショット屋内ローカライズ設定を導入し,提案したGLNを専用ゼロショットバージョンに拡張することで,その課題に対処する。
論文 参考訳(メタデータ) (2020-08-06T07:36:55Z) - CMRNet++: Map and Camera Agnostic Monocular Visual Localization in LiDAR
Maps [10.578312278413199]
CMRNet++は、新しい場所を効果的に一般化するより堅牢なモデルであり、カメラパラメータとは独立している。
我々は,全く新しい環境下での学習や微調整を行なわず,高精度なローカライズが可能な深層学習手法を実証する。
論文 参考訳(メタデータ) (2020-04-20T10:10:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。