論文の概要: A Unified BEV Model for Joint Learning of 3D Local Features and Overlap
Estimation
- arxiv url: http://arxiv.org/abs/2302.14511v1
- Date: Tue, 28 Feb 2023 12:01:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 16:42:46.466011
- Title: A Unified BEV Model for Joint Learning of 3D Local Features and Overlap
Estimation
- Title(参考訳): 3次元局所特徴の合同学習とオーバーラップ推定のための統一型BEVモデル
- Authors: Lin Li, Wendong Ding, Yongkun Wen, Yufei Liang, Yong Liu, Guowei Wan
- Abstract要約: 本稿では,3次元局所特徴の同時学習と重なり推定のための統合鳥眼ビュー(BEV)モデルを提案する。
提案手法は,特に重複の少ないシーンにおいて,重複予測における既存手法よりも優れていた。
- 参考スコア(独自算出の注目度): 12.499361832561634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pairwise point cloud registration is a critical task for many applications,
which heavily depends on finding the right correspondences from the two point
clouds. However, the low overlap between the input point clouds makes the
registration prone to fail, leading to mistaken overlapping and mismatched
correspondences, especially in scenes where non-overlapping regions contain
similar structures. In this paper, we present a unified bird's-eye view (BEV)
model for jointly learning of 3D local features and overlap estimation to
fulfill the pairwise registration and loop closure. Feature description based
on BEV representation is performed by a sparse UNet-like network, and the 3D
keypoints are extracted by a detection head for 2D locations and a regression
head for heights, respectively. For overlap detection, a cross-attention module
is applied for interacting contextual information of the input point clouds,
followed by a classification head to estimate the overlapping region. We
evaluate our unified model extensively on the KITTI dataset and Apollo-SouthBay
dataset. The experiments demonstrate that our method significantly outperforms
existing methods on overlap prediction, especially in scenes with small
overlaps. The registration precision also achieves top performance on both
datasets in terms of translation and rotation errors. Source codes will be
available soon.
- Abstract(参考訳): ペアワイズポイントクラウド登録は多くのアプリケーションにとって重要なタスクであり、2つのポイントクラウドから適切な対応を見つけることに大きく依存している。
しかし、入力点雲間の重なりが低ければ、登録が失敗しにくくなり、特に重複しない領域が類似した構造を含む場面では、重なりの重なりや不一致の対応が生じる。
本稿では,3次元局所特徴の同時学習と重なり推定を併用し,両面の登録とループ閉鎖を両立させる統一鳥眼ビュー(BEV)モデルを提案する。
bev表現に基づく特徴記述をスパースunetライクなネットワークで行い、これら3dキーポイントを2dロケーション用検出ヘッドと高さ用回帰ヘッドとでそれぞれ抽出する。
重なり検出には、入力点雲のコンテクスト情報間の相互作用にクロスアテンションモジュールを適用し、次に分類ヘッドを用いて重なり領域を推定する。
kittiデータセットとapollo-southbayデータセットで統一モデルを評価した。
実験により,本手法が既存の重なり予測手法,特に重なりが小さいシーンを有意に上回ることを示した。
登録精度は、翻訳および回転誤差の観点から、両方のデータセット上で最高のパフォーマンスを達成する。
ソースコードはもうすぐ入手できる。
関連論文リスト
- Equi-GSPR: Equivariant SE(3) Graph Network Model for Sparse Point Cloud Registration [2.814748676983944]
局所球面ユークリッド3次元等分散特性をSE(3)メッセージパッシングに基づく伝搬により埋め込んだグラフニューラルネットワークモデルを提案する。
我々のモデルは、主に記述モジュール、同変グラフ層、類似性、最終的な回帰層から構成される。
3DMatchおよびKITTIデータセットで行った実験は、最先端のアプローチと比較して、我々のモデルの魅力的で堅牢な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T06:48:01Z) - Instance-free Text to Point Cloud Localization with Relative Position Awareness [37.22900045434484]
テキスト・ツー・ポイント・クラウド クロスモーダル・ローカライゼーションは、未来のロボットと人間のコラボレーションにとって重要な視覚言語タスクである。
既存のアプローチの2つの重要な制限に対処する: 1) 地中実例への依存を入力とし、2) 潜在事例間の相対的な位置を無視する。
提案モデルは,テキストセル検索のための粗いステージと位置推定のための微細なステージを含む,2段階のパイプラインに従う。
論文 参考訳(メタデータ) (2024-04-27T09:46:49Z) - Dual Adaptive Transformations for Weakly Supervised Point Cloud
Segmentation [78.6612285236938]
弱制御点雲分割のための新しいDATモデル(textbfDual textbfAdaptive textbfTransformations)を提案する。
我々は,大規模S3DISデータセットとScanNet-V2データセットの2つの人気バックボーンを用いたDATモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-19T05:43:14Z) - CorrI2P: Deep Image-to-Point Cloud Registration via Dense Correspondence [51.91791056908387]
我々は,CorrI2Pと呼ばれる画像間クラウドの登録問題に対処するための,機能に基づく最初の高密度対応フレームワークを提案する。
具体的には、3次元の点雲の前に2次元画像が1対あるとすると、まずそれらを高次元の特徴空間に変換し、特徴を対称的に重なり合う領域に変換して、画像点雲が重なり合う領域を決定する。
論文 参考訳(メタデータ) (2022-07-12T11:49:31Z) - Learning to Register Unbalanced Point Pairs [10.369750912567714]
最近の3D登録法は,大規模あるいは部分的に重複する点対を効果的に扱うことができる。
非平衡点対に対する新しい3次元登録手法であるUPPNetを提案する。
論文 参考訳(メタデータ) (2022-07-09T08:03:59Z) - Focal Sparse Convolutional Networks for 3D Object Detection [121.45950754511021]
我々はスパースCNNの能力を高めるために2つの新しいモジュールを導入する。
焦点スパース・コンボリューション(Focals Conv)であり、焦点スパース・コンボリューションの多様変種である。
スパース・コンボリューションにおける空間的に学習可能な空間空間性は,高度な3次元物体検出に不可欠であることを示す。
論文 参考訳(メタデータ) (2022-04-26T17:34:10Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。
我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2021-11-15T08:27:21Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - D3Feat: Joint Learning of Dense Detection and Description of 3D Local
Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。
本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。
本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文 参考訳(メタデータ) (2020-03-06T12:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。