論文の概要: LoGG3D-Net: Locally Guided Global Descriptor Learning for 3D Place
Recognition
- arxiv url: http://arxiv.org/abs/2109.08336v1
- Date: Fri, 17 Sep 2021 03:32:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-20 14:32:57.176350
- Title: LoGG3D-Net: Locally Guided Global Descriptor Learning for 3D Place
Recognition
- Title(参考訳): LoGG3D-Net:3D位置認識のためのローカルガイド付きグローバルディスクリプタ学習
- Authors: Kavisha Vidanapathirana, Milad Ramezani, Peyman Moghadam, Sridha
Sridharan, Clinton Fookes
- Abstract要約: 追加のトレーニング信号(局所的整合性損失)が、リビジョン間で一貫性のある局所的特徴の学習にネットワークを導くことができることを示す。
私たちは、LoGG3D-Netと呼ばれるエンドツーエンドのトレーニング可能なアーキテクチャでアプローチを定式化します。
- 参考スコア(独自算出の注目度): 31.105598103211825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-based place recognition is an efficient and effective solution for
enabling re-localization within a pre-built map or global data association for
Simultaneous Localization and Mapping (SLAM). The accuracy of such an approach
is heavily dependent on the quality of the extracted scene-level
representation. While end-to-end solutions, which learn a global descriptor
from input point clouds, have demonstrated promising results, such approaches
are limited in their ability to enforce desirable properties at the local
feature level. In this paper, we demonstrate that the inclusion of an
additional training signal (local consistency loss) can guide the network to
learning local features which are consistent across revisits, hence leading to
more repeatable global descriptors resulting in an overall improvement in place
recognition performance. We formulate our approach in an end-to-end trainable
architecture called LoGG3D-Net. Experiments on two large-scale public
benchmarks (KITTI and MulRan) show that our method achieves mean $F1_{max}$
scores of $0.939$ and $0.968$ on KITTI and MulRan, respectively while operating
in near real-time.
- Abstract(参考訳): 検索に基づく位置認識は,構築済みの地図やslam(global data association for concurrent localization and mapping)内で再局在化を実現するための効率的かつ効果的なソリューションである。
このようなアプローチの精度は、抽出されたシーンレベルの表現の品質に大きく依存する。
入力ポイントクラウドからグローバルディスクリプタを学習するエンドツーエンドソリューションは、有望な結果を示しているが、そのようなアプローチは、ローカルな特徴レベルで望ましいプロパティを強制する能力に制限されている。
本稿では,追加の訓練信号(局所的一貫性損失)の導入により,再訪者間で一貫性のある局所的特徴の学習をネットワークに誘導できることを実証する。
私たちは、LoGG3D-Netと呼ばれるエンドツーエンドのトレーニング可能なアーキテクチャでアプローチを定式化します。
2つの大規模公開ベンチマーク (KITTI と MulRan) 実験により,我々の手法は,ほぼリアルタイムに動作しながら,平均$F1_{max}$スコアが0.939$と$0.968$であることを示す。
関連論文リスト
- FUSELOC: Fusing Global and Local Descriptors to Disambiguate 2D-3D Matching in Visual Localization [57.59857784298536]
直接2D-3Dマッチングアルゴリズムでは、メモリが大幅に削減されるが、より大きくあいまいな検索空間のために精度が低下する。
本研究では,2次元3次元探索フレームワーク内の重み付き平均演算子を用いて局所的およびグローバルな記述子を融合させることにより,この曖昧さに対処する。
ローカルのみのシステムの精度を常に改善し、メモリ要求を半減させながら階層的な手法に近い性能を達成する。
論文 参考訳(メタデータ) (2024-08-21T23:42:16Z) - Scalable and Efficient Hierarchical Visual Topological Mapping [3.114470292106496]
本研究では,階層的トポロジカルマッピング技術を用いて,最先端の手作り・学習用グローバル記述子の評価を行った。
複数の実行を経験的に分析した結果,連続性と特異性は最適大域的記述子にとって重要な特徴であることがわかった。
論文 参考訳(メタデータ) (2024-04-07T17:30:57Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - SphereVLAD++: Attention-based and Signal-enhanced Viewpoint Invariant
Descriptor [6.326554177747699]
SphereVLAD++ は注目度が高められた視点不変位置認識手法である。
SphereVLAD++は、小さな視点や完全に逆の視点差の下で、最先端の3D位置認識手法をすべて上回ることを示す。
論文 参考訳(メタデータ) (2022-07-06T20:32:43Z) - Learning Consistency from High-quality Pseudo-labels for Weakly
Supervised Object Localization [7.602783618330373]
より一貫したローカライゼーションを学習するための2段階のアプローチを提案する。
まず,マスクを用いた擬似ラベル生成アルゴリズムを提案し,擬似教師付き学習手法を用いてオブジェクトの局所化ネットワークを初期化する。
第2段階では,分類識別に基づく疑似ラベルの信頼度を簡易かつ効果的に評価する手法を提案する。
論文 参考訳(メタデータ) (2022-03-18T09:05:51Z) - An Entropy-guided Reinforced Partial Convolutional Network for Zero-Shot
Learning [77.72330187258498]
エントロピー誘導強化部分畳み込みネットワーク(ERPCNet)を提案する。
ERPCNetは、人間のアノテーションのない意味的関連性と視覚的相関に基づいて、局所性を抽出し、集約する。
グローバルな協力的局所性を動的に発見するだけでなく、ポリシー勾配最適化のためにより高速に収束する。
論文 参考訳(メタデータ) (2021-11-03T11:13:13Z) - Conformer: Local Features Coupling Global Representations for Visual
Recognition [72.9550481476101]
本稿では,畳み込み操作と自己アテンション機構を利用した表現学習のためのハイブリッドネットワーク構造,conformerを提案する。
実験では、コンフォーマーが同等のパラメータ複雑性の下で視覚変換器(DeiT-B)を2.3%上回ることが示されている。
論文 参考訳(メタデータ) (2021-05-09T10:00:03Z) - Re-rank Coarse Classification with Local Region Enhanced Features for
Fine-Grained Image Recognition [22.83821575990778]
そこで我々は,Top1の精度を向上させるため,TopN分類結果を局所的に拡張した埋め込み機能を用いて再評価した。
より効果的なセマンティクスグローバル機能を学ぶために、我々は、自動構築された階層的カテゴリ構造上のマルチレベル損失をデザインする。
本手法は,cub-200-2011,stanford cars,fgvc aircraftの3つのベンチマークで最新性能を実現する。
論文 参考訳(メタデータ) (2021-02-19T11:30:25Z) - Gait Recognition via Effective Global-Local Feature Representation and
Local Temporal Aggregation [28.721376937882958]
歩行認識は最も重要な生体計測技術の一つであり、多くの分野で応用されている。
近年の歩行認識フレームワークは、人間のグローバルな外観または地域から抽出された記述子によって各歩行フレームを表現している。
歩行認識のための識別的特徴表現を実現するための新しい特徴抽出・融合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T04:07:13Z) - DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF
Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。
3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。
各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文 参考訳(メタデータ) (2020-07-17T20:21:22Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。