論文の概要: BUFFER-X: Towards Zero-Shot Point Cloud Registration in Diverse Scenes
- arxiv url: http://arxiv.org/abs/2503.07940v1
- Date: Tue, 11 Mar 2025 00:40:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 19:17:13.520649
- Title: BUFFER-X: Towards Zero-Shot Point Cloud Registration in Diverse Scenes
- Title(参考訳): BUFFER-X: さまざまな場面におけるゼロショットポイントクラウドの登録に向けて
- Authors: Minkyun Seo, Hyungtae Lim, Kanghee Lee, Luca Carlone, Jaesik Park,
- Abstract要約: 一般化を制限する重要な要因は、環境固有のボクセルサイズと探索半径に依存すること、学習ベースのキーポイント検出器のドメイン外ロバスト性に乏しいこと、および生の座標の使用である。
我々は、ボクセルサイズ/探索半径を適応的に決定し、最遠点サンプリングを用いて学習検出器をバイパスし、(c)一貫した座標境界に対するパッチワイドスケール正規化を利用する、BUFFER-Xと呼ばれるゼロショット登録パイプラインを提案する。
- 参考スコア(独自算出の注目度): 34.71850178233064
- License:
- Abstract: Recent advances in deep learning-based point cloud registration have improved generalization, yet most methods still require retraining or manual parameter tuning for each new environment. In this paper, we identify three key factors limiting generalization: (a) reliance on environment-specific voxel size and search radius, (b) poor out-of-domain robustness of learning-based keypoint detectors, and (c) raw coordinate usage, which exacerbates scale discrepancies. To address these issues, we present a zero-shot registration pipeline called BUFFER-X by (a) adaptively determining voxel size/search radii, (b) using farthest point sampling to bypass learned detectors, and (c) leveraging patch-wise scale normalization for consistent coordinate bounds. In particular, we present a multi-scale patch-based descriptor generation and a hierarchical inlier search across scales to improve robustness in diverse scenes. We also propose a novel generalizability benchmark using 11 datasets that cover various indoor/outdoor scenarios and sensor modalities, demonstrating that BUFFER-X achieves substantial generalization without prior information or manual parameter tuning for the test datasets. Our code is available at https://github.com/MIT-SPARK/BUFFER-X.
- Abstract(参考訳): 近年のディープラーニングベースのポイントクラウド登録は一般化が進んでいるが、ほとんどの手法では新しい環境ごとに手動のパラメータチューニングやトレーニングが必要である。
本稿では,一般化を制限する3つの要因を同定する。
(a)環境特異的なボクセルサイズと探索半径に依存する。
b)学習に基づくキーポイント検出器のドメイン外ロバスト性、及び
(c)大規模不一致を悪化させる生の座標の使用
これらの問題に対処するため,BUFFER-X by というゼロショット登録パイプラインを提案する。
a) ボクセルサイズ/検索ラジイを適応的に決定する
b) 最遠点サンプリングを用いて学習検出器をバイパスし、
(c)一貫した座標境界に対するパッチワイドスケール正規化の活用。
特に,マルチスケールのパッチベースの記述子生成と階層的不整合探索を行い,多様なシーンの堅牢性を向上させる。
また,室内・屋外のシナリオやセンサのモダリティをカバーした11のデータセットを用いた新しい一般化性ベンチマークを提案し,BUFFER-Xが事前情報や手動パラメータチューニングを伴わずにかなりの一般化を実現することを示した。
私たちのコードはhttps://github.com/MIT-SPARK/BUFFER-Xで利用可能です。
関連論文リスト
- Inferring Neural Signed Distance Functions by Overfitting on Single Noisy Point Clouds through Finetuning Data-Driven based Priors [53.6277160912059]
本稿では,データ駆動型およびオーバーフィット型手法のプロースを推進し,より一般化し,高速な推論を行い,より高精度なニューラルネットワークSDFを学習する手法を提案する。
そこで本研究では,距離管理やクリーンポイントクラウド,あるいは点正規化を伴わずに,データ駆動型プリエントを微調整できる新しい統計的推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-25T16:48:44Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Implicit neural representation for change detection [15.741202788959075]
点雲の変化を検出する最も一般的なアプローチは、教師付き手法に基づいている。
Inlicit Neural Representation (INR) for continuous shape reconstruction と Gaussian Mixture Model for categorising change の2つのコンポーネントからなる教師なしアプローチを提案する。
本手法を都市スプロールのためのシミュレーションLiDAR点雲からなるベンチマークデータセットに適用する。
論文 参考訳(メタデータ) (2023-07-28T09:26:00Z) - Cascade-DETR: Delving into High-Quality Universal Object Detection [99.62131881419143]
高品質な普遍物体検出のためのカスケードDETRを提案する。
本稿では,オブジェクト中心情報を検出デコーダに明示的に統合するカスケードアテンション層を提案する。
最後に、多様なドメインから10のデータセットを含む汎用オブジェクト検出ベンチマークUDB10を紹介する。
論文 参考訳(メタデータ) (2023-07-20T17:11:20Z) - Learning Pairwise Interaction for Generalizable DeepFake Detection [20.723277551489186]
DeepFake生成技術の開発は、既知のタイプのDeepFake向けに設計された検出スキームに挑戦している。
我々は,異なる色空間表現からペアワイズ学習と補完情報を利用する,MCX-API(Multi-Channel Xception Attention Pairwise Interaction)を提案する。
実験の結果,提案手法は最先端のDeepfakes検出器よりも一般化可能であることがわかった。
論文 参考訳(メタデータ) (2023-02-26T10:39:08Z) - Using Set Covering to Generate Databases for Holistic Steganalysis [2.089615335919449]
我々は、CSM(Cover Source Mismatch)の起源を研究するために、処理パイプラインのグリッドを探索する。
集合被覆グリードアルゴリズムを用いて、集合内の代表とパイプライン間の最大の後悔を最小限に抑える代表パイプラインを選択する。
我々の分析は、多様性を育むためには、デノイング、シャープニング、ダウンサンプリングといったパラメータが重要であることも示しています。
論文 参考訳(メタデータ) (2022-11-07T10:53:02Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Deep Soft Procrustes for Markerless Volumetric Sensor Alignment [81.13055566952221]
本研究では、より堅牢なマルチセンサ空間アライメントを実現するために、マーカーレスデータ駆動対応推定を改善する。
我々は、幾何学的制約を終末的に典型的なセグメンテーションベースモデルに組み込み、対象のポーズ推定タスクと中間密な分類タスクをブリッジする。
実験により,マーカーベースの手法で同様の結果が得られ,マーカーレス手法よりも優れ,またキャリブレーション構造のポーズ変動にも頑健であることがわかった。
論文 参考訳(メタデータ) (2020-03-23T10:51:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。