論文の概要: Efficient 3D Point Cloud Feature Learning for Large-Scale Place
Recognition
- arxiv url: http://arxiv.org/abs/2101.02374v1
- Date: Thu, 7 Jan 2021 05:15:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 13:38:03.686344
- Title: Efficient 3D Point Cloud Feature Learning for Large-Scale Place
Recognition
- Title(参考訳): 大規模位置認識のための効率的な3Dポイントクラウド特徴学習
- Authors: Le Hui, Mingmei Cheng, Jin Xie, Jian Yang
- Abstract要約: 視覚的位置認識のためのグローバルディスクリプタを構築するために,効率的なポイントクラウド学習ネットワーク(EPC-Net)を開発した。
提案手法は,フレームあたりのパラメータ,FLOP,ランタイムを低減して,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 21.818744369503197
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Point cloud based retrieval for place recognition is still a challenging
problem due to drastic appearance and illumination changes of scenes in
changing environments. Existing deep learning based global descriptors for the
retrieval task usually consume a large amount of computation resources (e.g.,
memory), which may not be suitable for the cases of limited hardware resources.
In this paper, we develop an efficient point cloud learning network (EPC-Net)
to form a global descriptor for visual place recognition, which can obtain good
performance and reduce computation memory and inference time. First, we propose
a lightweight but effective neural network module, called ProxyConv, to
aggregate the local geometric features of point clouds. We leverage the spatial
adjacent matrix and proxy points to simplify the original edge convolution for
lower memory consumption. Then, we design a lightweight grouped VLAD network
(G-VLAD) to form global descriptors for retrieval. Compared with the original
VLAD network, we propose a grouped fully connected (GFC) layer to decompose the
high-dimensional vectors into a group of low-dimensional vectors, which can
reduce the number of parameters of the network and maintain the discrimination
of the feature vector. Finally, to further reduce the inference time, we
develop a simple version of EPC-Net, called EPC-Net-L, which consists of two
ProxyConv modules and one max pooling layer to aggregate global descriptors. By
distilling the knowledge from EPC-Net, EPC-Net-L can obtain discriminative
global descriptors for retrieval. Extensive experiments on the Oxford dataset
and three in-house datasets demonstrate that our proposed method can achieve
state-of-the-art performance with lower parameters, FLOPs, and runtime per
frame.
- Abstract(参考訳): 場所認識のためのポイントクラウドベースの検索は、環境変化におけるシーンの劇的な外観や照明の変化により、依然として困難な問題である。
検索タスクのための既存のディープラーニングベースのグローバル記述子は通常、限られたハードウェアリソースの場合に適さない大量の計算リソース(メモリなど)を消費する。
本稿では,効率的なポイントクラウド学習ネットワーク(EPC-Net)を開発し,視覚的位置認識のためのグローバルディスクリプタを構築する。
まず,ポイントクラウドの局所的な幾何学的特徴を集約する,軽量かつ効果的なニューラルネットワークモジュールであるproxyconvを提案する。
空間隣接行列とプロキシポイントを利用して、メモリ消費の低減のために元のエッジ畳み込みを単純化する。
そこで我々は,検索用グローバルディスクリプタを構築するために,軽量グループVLADネットワーク(G-VLAD)を設計する。
従来のVLADネットワークと比較して,高次元ベクトルを低次元ベクトル群に分解するグループ完全連結(GFC)層を提案し,ネットワークのパラメータ数を削減し,特徴ベクトルの識別を維持する。
最後に,2つのProxyConvモジュールと1つの最大プール層から構成され,グローバルな記述子を集約するEPC-Net-Lというシンプルなバージョンを開発する。
EPC-Netから知識を蒸留することにより、EPC-Net-Lは検索のための識別的グローバル記述子を得ることができる。
オックスフォードデータセットと3つの社内データセットの大規模な実験により、提案手法は、より低いパラメータ、FLOP、実行時間で最先端のパフォーマンスを実現することができることを示した。
関連論文リスト
- ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - PointeNet: A Lightweight Framework for Effective and Efficient Point
Cloud Analysis [28.54939134635978]
PointeNetは、ポイントクラウド分析に特化したネットワークである。
本手法は,分類/分割ヘッドとシームレスに統合したり,市販の3Dオブジェクト検出ネットワークに埋め込んだりすることで,柔軟性を示す。
ModelNet40、ScanObjectNN、ShapeNet KITTI、およびシーンレベルのデータセットKITTIを含むオブジェクトレベルのデータセットの実験は、ポイントクラウド分析における最先端メソッドよりもPointeNetの方が優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-12-20T03:34:48Z) - LACV-Net: Semantic Segmentation of Large-Scale Point Cloud Scene via
Local Adaptive and Comprehensive VLAD [13.907586081922345]
本稿では,大規模クラウドセマンティックセグメンテーションのための,LACV-Netと呼ばれるエンドツーエンドのディープニューラルネットワークを提案する。
提案するネットワークは,1) 局所適応的特徴拡張モジュール(LAFA) を適応的に学習し,局所的文脈を拡張させる,2) 局所的特徴を多層,マルチスケール,マルチ解像度で融合させて包括的グローバル記述ベクトルを表現する,包括的VLADモジュール,3) LAFAモジュールからの適応的重みを制限してセグメント境界を効果的に最適化する集約損失関数を含む。
論文 参考訳(メタデータ) (2022-10-12T02:11:00Z) - UPDesc: Unsupervised Point Descriptor Learning for Robust Registration [54.95201961399334]
UPDescは、ロバストポイントクラウド登録のためのポイント記述子を学習するための教師なしの方法である。
学習した記述子は既存の教師なし手法よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-08-05T17:11:08Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - PIG-Net: Inception based Deep Learning Architecture for 3D Point Cloud
Segmentation [0.9137554315375922]
そこで我々はPIG-Netと呼ばれるインセプションに基づくディープネットワークアーキテクチャを提案し,点雲の局所的および大域的幾何学的詳細を効果的に特徴付ける。
我々は2つの最先端データセット上でPIG-Netアーキテクチャの徹底的な実験的解析を行う。
論文 参考訳(メタデータ) (2021-01-28T13:27:55Z) - SoftPoolNet: Shape Descriptor for Point Cloud Completion and
Classification [93.54286830844134]
本稿では,点雲に基づく3次元オブジェクトの補完と分類手法を提案する。
デコーダの段階では,グローバルな活性化エントロピーの最大化を目的とした新しい演算子である地域畳み込みを提案する。
我々は,オブジェクトの完成度や分類,最先端の精度の達成など,異なる3次元タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2020-08-17T14:32:35Z) - Local Grid Rendering Networks for 3D Object Detection in Point Clouds [98.02655863113154]
CNNは強力だが、全点の雲を高密度の3Dグリッドに酸化した後、点データに直接畳み込みを適用するのは計算コストがかかる。
入力点のサブセットの小さな近傍を低解像度の3Dグリッドに独立してレンダリングする,新しい,原理化されたローカルグリッドレンダリング(LGR)演算を提案する。
ScanNetとSUN RGB-Dデータセットを用いた3次元オブジェクト検出のためのLGR-Netを検証する。
論文 参考訳(メタデータ) (2020-07-04T13:57:43Z) - LiteDenseNet: A Lightweight Network for Hyperspectral Image
Classification [2.696926374562295]
ハイパースペクトル画像分類のためのDenseNetに基づく軽量ネットワークアーキテクチャ(LiteDenseNet)を提案する。
GoogLeNetとPeleeNetにインスパイアされた我々は、入力の局所的およびグローバル的特徴を捉えるために、3次元の双方向の高密度層を設計する。
畳み込みは計算集約的な演算であるため、計算コストとパラメータサイズをさらに削減するためにグループ畳み込みを導入する。
論文 参考訳(メタデータ) (2020-04-17T08:38:52Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。