論文の概要: C-GenReg: Training-Free 3D Point Cloud Registration by Multi-View-Consistent Geometry-to-Image Generation with Probabilistic Modalities Fusion
- arxiv url: http://arxiv.org/abs/2604.16680v1
- Date: Fri, 17 Apr 2026 20:29:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.126425
- Title: C-GenReg: Training-Free 3D Point Cloud Registration by Multi-View-Consistent Geometry-to-Image Generation with Probabilistic Modalities Fusion
- Title(参考訳): C-GenReg: 確率的モーダリティ融合による多視点幾何画像生成による訓練不要3Dポイントクラウド登録
- Authors: Yuval Haitman, Amit Efraim, Joseph M. Francos,
- Abstract要約: C-GenRegは3Dポイントクラウド登録のためのトレーニング不要のフレームワークである。
これは、世界規模の生成先行と登録指向のビジョンファウンデーションモデルの相補的な強みを活用する。
実屋外のLiDARデータ上で動作可能な生成登録フレームワークを初めて紹介する。
- 参考スコア(独自算出の注目度): 14.324844136229649
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce C-GenReg, a training-free framework for 3D point cloud registration that leverages the complementary strengths of world-scale generative priors and registration-oriented Vision Foundation Models (VFMs). Current learning-based 3D point cloud registration methods struggle to generalize across sensing modalities, sampling differences, and environments. Hence, C-GenReg augments the geometric point cloud registration branch by transferring the matching problem into an auxiliary image domain, where VFMs excel, using a World Foundation Model to synthesize multi-view-consistent RGB representations from the input geometry. This generative transfer, preserves spatial coherence across source and target views without any fine-tuning. From these generated views, a VFM pretrained for finding dense correspondences extracts matches. The resulting pixel correspondences are lifted back to 3D via the original depth maps. To further enhance robustness, we introduce a "Match-then-Fuse" probabilistic cold-fusion scheme that combines two independent correspondence posteriors, that of the generated-RGB branch with that of the raw geometric branch. This principled fusion preserves each modality inductive bias and provides calibrated confidence without any additional learning. C-GenReg is zero-shot and plug-and-play: all modules are pretrained and operate without fine-tuning. Extensive experiments on indoor (3DMatch, ScanNet) and outdoor (Waymo) benchmarks demonstrate strong zero-shot performance and superior cross-domain generalization. For the first time, we demonstrate a generative registration framework that operates successfully on real outdoor LiDAR data, where no imagery data is available.
- Abstract(参考訳): C-GenRegは3Dポイントクラウド登録のためのトレーニング不要のフレームワークで、世界規模の生成前と登録指向のビジョンファウンデーションモデル(VFM)の相補的な強みを利用する。
現在の学習ベースの3Dポイントクラウド登録手法は、センシングのモダリティ、違いのサンプリング、環境の一般化に苦慮している。
したがって、C-GenRegは、マッチング問題を補助画像領域に転送することで、幾何学点雲登録枝を拡張し、VFMは、ワールドファンデーションモデルを用いて入力幾何学から多視点のRGB表現を合成する。
この生成転送は、微調整なしでソースとターゲットビュー間の空間的コヒーレンスを保存する。
これらのビューから、密度の高い対応関係の抽出マッチを見つけるために予め訓練されたVFMが生成される。
結果のピクセル対応は、元の深度マップを介して3Dに持ち上げられる。
さらにロバスト性を高めるために,生成したRGBブランチと生の幾何学的ブランチの2つの独立対応部分を組み合わせた,"Match-then-Fuse"確率的コールドフュージョン方式を導入する。
この原理的融合は、各モード誘導バイアスを保存し、追加の学習なしに校正された信頼を提供する。
C-GenRegはゼロショットでプラグイン&プレイで、すべてのモジュールは微調整なしで事前トレーニングされ、動作します。
屋内 (3DMatch, ScanNet) および屋外 (Waymo) ベンチマークの大規模な実験は、強いゼロショット性能と優れたクロスドメイン一般化を示す。
画像データが得られない実屋外LiDARデータ上で, 実効動作する生成登録フレームワークを初めて実演する。
関連論文リスト
- UniQueR: Unified Query-based Feedforward 3D Reconstruction [68.01984215138098]
提案するUniQueRは,未提示画像からの3次元再構成を効率よく正確に行うための,クエリベースの統合フィードフォワードフレームワークである。
我々のモデルは、明示的な幾何学的クエリとして機能する3Dアンカー点のコンパクトな集合を学習する。
Mip-NeRF 360とVR-NeRFの実験により、UniQueRはレンダリング品質と幾何学的精度の両方において最先端のフィードフォワード法を上回ることを示した。
論文 参考訳(メタデータ) (2026-03-24T06:42:02Z) - Generative Point Cloud Registration [39.19949818461193]
本稿では,新しい3次元登録パラダイムであるジェネレーティブ・ポイント・クラウド・レジストレーションを提案する。
私たちのキーとなるアイデアは、ソースとターゲットポイントのクラウドに整合した、クロスビューの一貫性のあるイメージペアを生成することです。
そこで本研究では,マッチング固有で制御可能な2次元生成モデルであるMatch-ControlNetを提案する。
論文 参考訳(メタデータ) (2025-12-10T08:01:20Z) - FUSER: Feed-Forward MUltiview 3D Registration Transformer and SE(3)$^N$ Diffusion Refinement [39.19949818461193]
Fは、全てのスキャンを統一されたコンパクトな潜在空間で処理する最初のフィードフォワードマルチビュー登録変換器である。
F はペアワイズ推定なしでグローバルなポーズを予測する。
3DMatch, ScanNet, ArkitScenesの実験により, 本手法が優れた登録精度と優れた計算効率を実現することを示す。
論文 参考訳(メタデータ) (2025-12-10T07:11:22Z) - Cross-modal feature fusion for robust point cloud registration with ambiguous geometry [6.742883954812066]
本稿では,ポイントクラウド登録のためのクロスモーダル特徴融合法を提案する。
2段階の3Dポイントクラウド機能と2Dイメージ機能を統合している。
すべてのベンチマークで最先端の登録性能を達成する。
論文 参考訳(メタデータ) (2025-05-19T13:22:46Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - ZeroReg: Zero-Shot Point Cloud Registration with Foundation Models [77.84408427496025]
最先端の3Dポイントクラウド登録方法は、トレーニングのためにラベル付き3Dデータセットに依存している。
我々は2次元基礎モデルを用いて3次元対応を予測するゼロショット登録手法であるZeroRegを紹介する。
論文 参考訳(メタデータ) (2023-12-05T11:33:16Z) - Improving RGB-D Point Cloud Registration by Learning Multi-scale Local
Linear Transformation [38.64501645574878]
ポイントクラウド登録は、2つのポイントクラウドスキャン間の幾何学的変換を推定することを目的としている。
近年,RGB-Dデータをより正確な対応に利用しようと試みている。
マルチスケールな局所線形変換を用いたGAVE(Geometry-Aware Visual Feature Extractor)を提案する。
論文 参考訳(メタデータ) (2022-08-31T14:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。