論文の概要: D3Former: Jointly Learning Repeatable Dense Detectors and
Feature-enhanced Descriptors via Saliency-guided Transformer
- arxiv url: http://arxiv.org/abs/2312.12970v1
- Date: Wed, 20 Dec 2023 12:19:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 15:53:21.851241
- Title: D3Former: Jointly Learning Repeatable Dense Detectors and
Feature-enhanced Descriptors via Saliency-guided Transformer
- Title(参考訳): d3former:saliency-guided transformerによる繰り返し可能な高密度検出器と特徴強調ディスクリプタを共同学習する
- Authors: Junjie Gao, Pengfei Wang, Qiujie Dong, Qiong Zeng, Shiqing Xin,
Caiming Zhang
- Abstract要約: 我々は、リピータブルなtextbfDetector と機能強化された textbfDescriptors の合同学習を必要とする textitD3Former と呼ばれるサリエンシ誘導型 Transtextbfformer を導入する。
提案手法は,常に最先端のクラウドマッチング手法より優れている。
- 参考スコア(独自算出の注目度): 14.056531181678467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Establishing accurate and representative matches is a crucial step in
addressing the point cloud registration problem. A commonly employed approach
involves detecting keypoints with salient geometric features and subsequently
mapping these keypoints from one frame of the point cloud to another. However,
methods within this category are hampered by the repeatability of the sampled
keypoints. In this paper, we introduce a saliency-guided trans\textbf{former},
referred to as \textit{D3Former}, which entails the joint learning of
repeatable \textbf{D}ense \textbf{D}etectors and feature-enhanced
\textbf{D}escriptors. The model comprises a Feature Enhancement Descriptor
Learning (FEDL) module and a Repetitive Keypoints Detector Learning (RKDL)
module. The FEDL module utilizes a region attention mechanism to enhance
feature distinctiveness, while the RKDL module focuses on detecting repeatable
keypoints to enhance matching capabilities. Extensive experimental results on
challenging indoor and outdoor benchmarks demonstrate that our proposed method
consistently outperforms state-of-the-art point cloud matching methods.
Notably, tests on 3DLoMatch, even with a low overlap ratio, show that our
method consistently outperforms recently published approaches such as RoReg and
RoITr. For instance, with the number of extracted keypoints reduced to 250, the
registration recall scores for RoReg, RoITr, and our method are 64.3\%, 73.6\%,
and 76.5\%, respectively.
- Abstract(参考訳): ポイントクラウド登録問題に対処する上で、正確で代表的なマッチングを確立することが重要なステップである。
一般的に用いられるアプローチは、厳密な幾何学的特徴を持つキーポイントを検出し、その後、これらのキーポイントをポイントクラウドのあるフレームから別のフレームにマッピングする。
しかし、このカテゴリのメソッドは、サンプリングされたキーポイントの再現性によって阻害される。
本稿では,リピータブルな \textbf{D}ense \textbf{D}etectors と機能強化された \textbf{D}escriptors の共用学習を伴い,サリエンシ誘導型 Trans\textbf{former} を \textit{D3Former} と呼ぶ。
このモデルは、機能強化記述子学習(FEDL)モジュールと反復キーポイント検出子学習(RKDL)モジュールからなる。
FEDLモジュールは特徴の特長を高めるために領域注意機構を使用し、RKDLモジュールは反復可能なキーポイントの検出に重点を置いてマッチング機能を強化する。
屋内および屋外のベンチマークに挑戦する実験の結果から,提案手法が最先端のクラウドマッチング手法を一貫して上回っていることが示された。
特に、3DLoMatchのテストは、重複率が低いとしても、我々の手法はRoRegやRoITrといった最近発表されたアプローチよりも一貫して優れていることを示す。
例えば、抽出されたキーポイント数が250に減少すると、RoReg、RoITr、および我々のメソッドの登録リコールスコアはそれぞれ64.3\%、73.6\%、76.5\%となる。
関連論文リスト
- Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Open-Vocabulary Animal Keypoint Detection with Semantic-feature Matching [74.75284453828017]
Open-Vocabulary Keypoint Detection (OVKD)タスクは、任意の種類のキーポイントを特定するためにテキストプロンプトを使用するように設計されている。
セマンティック・フェールマッチング(KDSM)を用いた開語彙キーポイント検出(Open-Vocabulary Keypoint Detection)という新しいフレームワークを開発した。
このフレームワークは視覚と言語モデルを組み合わせて、言語機能とローカルキーポイント視覚機能との相互作用を作成する。
論文 参考訳(メタデータ) (2023-10-08T07:42:41Z) - KDD-LOAM: Jointly Learned Keypoint Detector and Descriptors Assisted
LiDAR Odometry and Mapping [9.609585217048664]
確率的検出損失を有するマルチタスク完全畳み込みネットワークに基づく密結合型キーポイント検出器とディスクリプタを提案する。
屋内および屋外の両方のデータセットで実験したところ、TCKDDはポイントクラウドの登録において最先端のパフォーマンスを達成することがわかった。
また、キーポイント検出器とディスクリプタ支援LiDAR odometry and Mapping framework (KDD-LOAM) を設計し、その実時間オドメトリはキーポイント記述子マッチングに基づくRANSACに依存している。
論文 参考訳(メタデータ) (2023-09-27T04:10:52Z) - SC3K: Self-supervised and Coherent 3D Keypoints Estimation from Rotated,
Noisy, and Decimated Point Cloud Data [17.471342278936365]
そこで本研究では,任意のオブジェクトカテゴリからキーポイントを推定する手法を提案する。
我々は,キーポイント推定のための自己指導型トレーニング戦略を提案することで,これらのデシダータを実現する。
提案手法によって推定されるキーポイントと最先端の教師なしアプローチのキーポイントを比較した。
論文 参考訳(メタデータ) (2023-08-10T08:10:01Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Deep Hough Voting for Robust Global Registration [52.40611370293272]
6次元変換パラメータ空間におけるハフ投票を利用した実世界の3Dスキャンのペア登録のための効率的なフレームワークを提案する。
提案手法は, 3DMatch と 3DLoMatch のベンチマークにおいて, KITTI odometry データセットで同等の性能を達成しながら, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-09-09T14:38:06Z) - UPDesc: Unsupervised Point Descriptor Learning for Robust Registration [54.95201961399334]
UPDescは、ロバストポイントクラウド登録のためのポイント記述子を学習するための教師なしの方法である。
学習した記述子は既存の教師なし手法よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-08-05T17:11:08Z) - Point Cloud Registration using Representative Overlapping Points [10.843159482657303]
本稿では,登録のための識別機能を備えた代表オーバーラップポイントを用いた新しいディープラーニングモデル ROPNetを提案する。
具体的には,エンコーダを用いてポイントオーバーラップスコアの予測にグローバルな特徴を抽出するコンテキスト誘導モジュールを提案する。
ノイズと部分重なり合う点雲を用いたModelNet40上での実験により,提案手法が従来の学習手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-07-06T12:52:22Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - PointDSC: Robust Point Cloud Registration using Deep Spatial Consistency [38.93610732090426]
本稿では,空間的整合性を明確に組み込んだ新しいディープニューラルネットワークであるPointDSCを提案する。
本手法は,いくつかの実世界のデータセットにおいて,最先端の手作りおよび学習に基づく異常者拒絶アプローチを上回っている。
論文 参考訳(メタデータ) (2021-03-09T14:56:08Z) - Unsupervised Learning of 3D Point Set Registration [15.900382629390297]
点雲登録は、幾何変換を探索することで一対の点集合を整列する過程である。
本稿では,新たに導入された深部空間相関表現(SCR)機能に基づく,新しい教師なし登録フレームワークであるDeep-3DAlignerを提案する。
提案手法は,まずランダムに遅延するSCR特徴量を最適化し,次に幾何変換に復号し,ソースとターゲットの点集合を整列させる。
論文 参考訳(メタデータ) (2020-06-11T05:21:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。