論文の概要: Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space
- arxiv url: http://arxiv.org/abs/2504.21467v1
- Date: Wed, 30 Apr 2025 09:42:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 19:28:23.697216
- Title: Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space
- Title(参考訳): オートエンコーダ潜在空間における最適化によるマルチビューポイントクラウド登録
- Authors: Luc Vedrenne, Sylvain Faisan, Denis Fortun,
- Abstract要約: ポイントクラウドの剛性登録は、3Dコンピュータビジョンの基本的な問題である。
多数のビューを効率的に処理できるマルチビュー登録方式であるPOLARを導入する。
提案手法は, 合成データおよび実データに対する最先端手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 0.4759689296481272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Point cloud rigid registration is a fundamental problem in 3D computer vision. In the multiview case, we aim to find a set of 6D poses to align a set of objects. Methods based on pairwise registration rely on a subsequent synchronization algorithm, which makes them poorly scalable with the number of views. Generative approaches overcome this limitation, but are based on Gaussian Mixture Models and use an Expectation-Maximization algorithm. Hence, they are not well suited to handle large transformations. Moreover, most existing methods cannot handle high levels of degradations. In this paper, we introduce POLAR (POint cloud LAtent Registration), a multiview registration method able to efficiently deal with a large number of views, while being robust to a high level of degradations and large initial angles. To achieve this, we transpose the registration problem into the latent space of a pretrained autoencoder, design a loss taking degradations into account, and develop an efficient multistart optimization strategy. Our proposed method significantly outperforms state-of-the-art approaches on synthetic and real data. POLAR is available at github.com/pypolar/polar or as a standalone package which can be installed with pip install polaregistration.
- Abstract(参考訳): ポイントクラウドの剛性登録は、3Dコンピュータビジョンの基本的な問題である。
マルチビューの場合、オブジェクトの集合をアライメントする6Dポーズのセットを見つけることを目指している。
ペア登録に基づく手法は、後続の同期アルゴリズムに依存しており、ビューの数でスケーラビリティが低い。
生成的アプローチはこの制限を克服するが、ガウス混合モデルに基づいて予測最大化アルゴリズムを使用する。
したがって、それらは大きな変換を扱うのに適していない。
さらに、既存のほとんどの手法は高いレベルの劣化を処理できない。
本稿では,多視点登録方式であるPOLAR(Point cloud LAtent Registration)を提案する。
これを実現するために、事前訓練されたオートエンコーダの潜在空間に登録問題を変換し、劣化を考慮した損失を設計し、効率的なマルチスタート最適化戦略を開発する。
提案手法は, 合成データおよび実データに対する最先端手法を著しく上回っている。
POLAR はgithub.com/pypolar/polar または pip をインストールしてインストール可能なスタンドアロンパッケージとして利用できる。
関連論文リスト
- MCGS: Multiview Consistency Enhancement for Sparse-View 3D Gaussian Radiance Fields [73.49548565633123]
3Dガウシアンによって表現される放射場は、高いトレーニング効率と高速レンダリングの両方を提供する、新しいビューの合成に優れている。
既存の手法では、高密度推定ネットワークからの奥行き先を組み込むことが多いが、入力画像に固有の多視点一貫性を見落としている。
本稿では,3次元ガウス・スプレイティング(MCGS)に基づくビュー・フレームワークを提案し,スパークス・インプット・ビューからシーンを再構築する。
論文 参考訳(メタデータ) (2024-10-15T08:39:05Z) - Incremental Multiview Point Cloud Registration with Two-stage Candidate Retrieval [12.528821749262931]
マルチビューポイントクラウド登録は、様々なコンピュータビジョンタスクの基盤となる。
本稿では,すべてのスキャンを段階的にメタ形状に登録するインクリメンタルなマルチビューポイントクラウド登録手法を提案する。
論文 参考訳(メタデータ) (2024-07-10T10:24:28Z) - GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - L-PR: Exploiting LiDAR Fiducial Marker for Unordered Low Overlap Multiview Point Cloud Registration [5.2357168261831335]
本稿では,非秩序な低重なり点群を登録するL-PRという新しいフレームワークを提案する。
我々はこれらをLiDARフィデューシャルマーカーと呼んでいるが、人気のある AprilTag や ArUco のマーカーと同じである。
提案手法が従来の最先端手法を上回ることを示すため,定性的かつ定量的な実験を行った。
論文 参考訳(メタデータ) (2024-06-05T14:08:13Z) - PosDiffNet: Positional Neural Diffusion for Point Cloud Registration in
a Large Field of View with Perturbations [27.45001809414096]
PosDiffNetは、3Dコンピュータビジョンにおけるポイントクラウド登録のモデルである。
ベルトラミフローに基づくグラフニューラル偏微分方程式(PDE)を用いて高次元特徴を求める。
我々は、点雲間のアライメントを容易にするために、高特徴類似度スコアから導かれる多レベル対応を用いる。
我々はPosDiffNetを複数の3Dポイントクラウドデータセット上で評価し、摂動を伴う広い視野でのポイントクラウド登録において、最先端(SOTA)性能を達成することを検証した。
論文 参考訳(メタデータ) (2024-01-06T08:58:15Z) - Pyramid Semantic Graph-based Global Point Cloud Registration with Low
Overlap [27.362946585463824]
グローバルポイントクラウドの登録は、ループ閉鎖や再ローカライゼーションといった多くのロボティクスタスクにおいて不可欠である。
残念なことに、登録はポイントクラウド間の重複が低いことに悩まされることが多い。
本稿では,重複度が低い点登録問題に対処する頑健な枠組みを提案する。
論文 参考訳(メタデータ) (2023-07-22T16:05:23Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - Efficient View Clustering and Selection for City-Scale 3D Reconstruction [1.1011268090482573]
本稿では,MVSアルゴリズムを任意の画像集合に拡張するための新しい手法を提案する。
提案手法は、ポーズと幾何学のほぼ均一な分布を利用して、重なり合うクラスタの集合を構築する。
クラスタリングはペアの可視情報とは独立しているため、提案アルゴリズムは既存の文献よりも高速に動作し、大規模な並列化を可能にする。
論文 参考訳(メタデータ) (2022-07-18T08:33:52Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。