論文の概要: CMRNet++: Map and Camera Agnostic Monocular Visual Localization in LiDAR
Maps
- arxiv url: http://arxiv.org/abs/2004.13795v2
- Date: Fri, 22 May 2020 09:00:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 18:30:18.691564
- Title: CMRNet++: Map and Camera Agnostic Monocular Visual Localization in LiDAR
Maps
- Title(参考訳): CMRNet++:LiDARマップにおけるマップとカメラ非依存の単眼視覚像定位
- Authors: Daniele Cattaneo, Domenico Giorgio Sorrenti, Abhinav Valada
- Abstract要約: CMRNet++は、新しい場所を効果的に一般化するより堅牢なモデルであり、カメラパラメータとは独立している。
我々は,全く新しい環境下での学習や微調整を行なわず,高精度なローカライズが可能な深層学習手法を実証する。
- 参考スコア(独自算出の注目度): 10.578312278413199
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Localization is a critically essential and crucial enabler of autonomous
robots. While deep learning has made significant strides in many computer
vision tasks, it is still yet to make a sizeable impact on improving
capabilities of metric visual localization. One of the major hindrances has
been the inability of existing Convolutional Neural Network (CNN)-based pose
regression methods to generalize to previously unseen places. Our recently
introduced CMRNet effectively addresses this limitation by enabling map
independent monocular localization in LiDAR-maps. In this paper, we now take it
a step further by introducing CMRNet++, which is a significantly more robust
model that not only generalizes to new places effectively, but is also
independent of the camera parameters. We enable this capability by combining
deep learning with geometric techniques, and by moving the metric reasoning
outside the learning process. In this way, the weights of the network are not
tied to a specific camera. Extensive evaluations of CMRNet++ on three
challenging autonomous driving datasets, i.e., KITTI, Argoverse, and Lyft5,
show that CMRNet++ outperforms CMRNet as well as other baselines by a large
margin. More importantly, for the first-time, we demonstrate the ability of a
deep learning approach to accurately localize without any retraining or
fine-tuning in a completely new environment and independent of the camera
parameters.
- Abstract(参考訳): ローカライゼーションは自律ロボットにとって極めて重要かつ不可欠な実現手段である。
ディープラーニングは多くのコンピュータビジョンタスクにおいて大きな進歩を遂げてきたが、メトリクスの視覚的ローカライゼーションの能力向上にはまだ大きな影響を与えていない。
主要な障害の1つは、既存の畳み込みニューラルネットワーク(CNN)ベースのポーズ回帰手法が、これまで見つからなかった場所に一般化できないことである。
最近導入したCMRNetは、LiDAR-mapsにおけるマップ独立な単分子局在化を可能にすることにより、この制限に効果的に対処する。
本稿では,CMRNet++を導入することでさらに一歩進める。CMRNet++は,新しい場所に効果的に一般化するだけでなく,カメラパラメータにも依存しない,はるかに堅牢なモデルである。
我々は,深層学習と幾何学的手法を組み合わせることで,メトリクス推論を学習プロセス外に移動させることにより,この能力を実現する。
このように、ネットワークの重みは特定のカメラに縛られていない。
3つの挑戦的な自律運転データセット(KITTI、Argoverse、Lyft5)に対するCMRNet++の大規模な評価は、CMRNetと他のベースラインを大きなマージンで上回ることを示している。
より重要なことは、初めて、全く新しい環境で再トレーニングや微調整をすることなく、カメラパラメータに依存しない、正確なローカライズを行うディープラーニングアプローチの能力を示すことだ。
関連論文リスト
- SODAWideNet -- Salient Object Detection with an Attention augmented Wide
Encoder Decoder network without ImageNet pre-training [3.66237529322911]
我々は、ImageNet事前トレーニングなしで、Salient Object Detectionを直接訓練したスクラッチからニューラルネットワークを開発することを検討する。
本稿では,Salient Object Detection のためのエンコーダデコーダ型ネットワーク SODAWideNet を提案する。
SODAWideNet-S (3.03M) と SODAWideNet (9.03M) の2つの変種は、5つのデータセット上の最先端モデルと競合する性能を達成する。
論文 参考訳(メタデータ) (2023-11-08T16:53:44Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - CondenseNeXt: An Ultra-Efficient Deep Neural Network for Embedded
Systems [0.0]
畳み込みニューラルネットワーク(英: Convolutional Neural Network, CNN)は、画像センサが捉えた視覚画像の分析に広く用いられているディープニューラルネットワーク(DNN)のクラスである。
本稿では,組込みシステム上でのリアルタイム推論のために,既存のCNNアーキテクチャの性能を改善するために,深層畳み込みニューラルネットワークアーキテクチャの新しい変種を提案する。
論文 参考訳(メタデータ) (2021-12-01T18:20:52Z) - StereoSpike: Depth Learning with a Spiking Neural Network [0.0]
深度推定のためのエンドツーエンドのニューロモルフィック手法を提案する。
我々はSpiking Neural Network (SNN) と、StereoSpikeという名前のU-Netライクなエンコーダデコーダアーキテクチャを用いている。
このアーキテクチャは、スポーキング以外のアーキテクチャよりも、非常によく一般化されていることを実証します。
論文 参考訳(メタデータ) (2021-09-28T14:11:36Z) - Markov Localisation using Heatmap Regression and Deep Convolutional
Odometry [59.33322623437816]
我々は,最新のディープラーニングハードウェアを活用する新しいCNNベースのローカライゼーション手法を提案する。
画像に基づくローカライゼーションと,1つのニューラルネットワーク内でのオドメトリーに基づく確率伝搬を行うハイブリッドCNNを作成する。
論文 参考訳(メタデータ) (2021-06-01T10:28:49Z) - PCLs: Geometry-aware Neural Reconstruction of 3D Pose with Perspective
Crop Layers [111.55817466296402]
我々は、カメラ幾何学に基づく関心領域の視点作物であるパースペクティブ・クロップ・レイヤ(PCL)を紹介する。
PCLは、エンドツーエンドのトレーニングと基礎となるニューラルネットワークのパラメータ数を残しながら、位置依存的な視点効果を決定論的に除去する。
PCLは、既存の3D再構成ネットワークを幾何学的に認識することで、容易に精度を向上させる手段を提供する。
論文 参考訳(メタデータ) (2020-11-27T08:48:43Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - SynDistNet: Self-Supervised Monocular Fisheye Camera Distance Estimation
Synergized with Semantic Segmentation for Autonomous Driving [37.50089104051591]
モノクル深度推定のための最先端の自己教師型学習アプローチは、通常、スケールの曖昧さに悩まされる。
本稿では,魚眼カメラ画像とピンホールカメラ画像の自己教師付き単眼距離推定を改善するための,新しいマルチタスク学習手法を提案する。
論文 参考訳(メタデータ) (2020-08-10T10:52:47Z) - When Residual Learning Meets Dense Aggregation: Rethinking the
Aggregation of Deep Neural Networks [57.0502745301132]
我々は,グローバルな残差学習と局所的なマイクロセンスアグリゲーションを備えた新しいアーキテクチャであるMicro-Dense Netsを提案する。
我々のマイクロセンスブロックはニューラルアーキテクチャ検索に基づくモデルと統合して性能を向上させることができる。
論文 参考訳(メタデータ) (2020-04-19T08:34:52Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。