論文の概要: Shape registration in the time of transformers
- arxiv url: http://arxiv.org/abs/2106.13679v2
- Date: Mon, 28 Jun 2021 07:56:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 11:10:43.563169
- Title: Shape registration in the time of transformers
- Title(参考訳): 変圧器における形状登録
- Authors: Giovanni Trappolini, Luca Cosmo, Luca Moschella, Riccardo Marin,
Simone Melzi, Emanuele Rodol\`a
- Abstract要約: 本研究では,非剛性3次元点雲の効率的な登録のための変圧器ベース手法を提案する。
このアーキテクチャの潜在能力を生かして、基礎的真理対応のスパースセットだけを必要とするモデルを訓練することができる。
- 参考スコア(独自算出の注目度): 9.728331219460287
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a transformer-based procedure for the efficient
registration of non-rigid 3D point clouds. The proposed approach is data-driven
and adopts for the first time the transformer architecture in the registration
task. Our method is general and applies to different settings. Given a fixed
template with some desired properties (e.g. skinning weights or other animation
cues), we can register raw acquired data to it, thereby transferring all the
template properties to the input geometry. Alternatively, given a pair of
shapes, our method can register the first onto the second (or vice-versa),
obtaining a high-quality dense correspondence between the two. In both
contexts, the quality of our results enables us to target real applications
such as texture transfer and shape interpolation. Furthermore, we also show
that including an estimation of the underlying density of the surface eases the
learning process. By exploiting the potential of this architecture, we can
train our model requiring only a sparse set of ground truth correspondences
($10\sim20\%$ of the total points). The proposed model and the analysis that we
perform pave the way for future exploration of transformer-based architectures
for registration and matching applications. Qualitative and quantitative
evaluations demonstrate that our pipeline outperforms state-of-the-art methods
for deformable and unordered 3D data registration on different datasets and
scenarios.
- Abstract(参考訳): 本稿では,非剛性3次元点雲の効率的な登録のための変圧器に基づく手法を提案する。
提案手法はデータ駆動型であり、登録タスクにおいて初めてトランスフォーマーアーキテクチャを採用する。
我々の方法は一般的であり、異なる設定に当てはまる。
いくつかの望ましい特性を持つ固定テンプレート(例)が与えられる。
スキンウェイトや他のアニメーションキュー) 取得した生データを登録することで、すべてのテンプレートプロパティを入力ジオメトリに転送することができる。
あるいは、一対の形状を与えられた場合、この方法は第1を第2(あるいはその逆)に登録し、2つの間の高品質な密度対応を得る。
両方の文脈において、結果の品質は、テクスチャ転送や形状補間といった実際の応用を目標にすることができる。
さらに,表面の密度を推定することにより,学習プロセスが簡単になることを示す。
このアーキテクチャの潜在能力を生かして、基礎的真理対応のスパースセットだけを必要とするモデルを訓練することができる(全点の10\sim20\%$)。
提案するモデルと解析により、登録およびマッチングアプリケーションのためのトランスフォーマーベースのアーキテクチャの今後の探究の道が開けた。
定性的かつ定量的な評価は,異なるデータセットやシナリオの3dデータ登録を変形可能かつ無秩序にするために,パイプラインが最先端の手法よりも優れていることを示している。
関連論文リスト
- Equi-GSPR: Equivariant SE(3) Graph Network Model for Sparse Point Cloud Registration [2.814748676983944]
局所球面ユークリッド3次元等分散特性をSE(3)メッセージパッシングに基づく伝搬により埋め込んだグラフニューラルネットワークモデルを提案する。
我々のモデルは、主に記述モジュール、同変グラフ層、類似性、最終的な回帰層から構成される。
3DMatchおよびKITTIデータセットで行った実験は、最先端のアプローチと比較して、我々のモデルの魅力的で堅牢な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T06:48:01Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Global Point Cloud Registration Network for Large Transformations [46.7301374772952]
ローカルトランスフォーメーションの優れたパフォーマンスを維持しつつ,大規模なトランスフォーメーションが発生するケースに直面するアーキテクチャであるReLaToを提案する。
本稿では,ソフトマックスプーリング層を用いて2つの点集合間の相互一致関係を抽出し,最も確実な一致を抽出する。
そして、得られた一致と潜伏特徴の両方に目標誘導復調ステップを適用し、最終的な微妙な登録を推定する。
論文 参考訳(メタデータ) (2024-03-26T18:52:48Z) - AdaPoinTr: Diverse Point Cloud Completion with Adaptive Geometry-Aware
Transformers [94.11915008006483]
本稿では,ポイントクラウドの完了をセット・ツー・セットの翻訳問題として再定義する手法を提案する。
我々は、ポイントクラウド補完のためにTransformerエンコーダデコーダアーキテクチャを採用したPoinTrと呼ばれる新しいモデルを設計する。
本手法は,PCNで6.53 CD,ShapeNet-55で0.81 CD,現実世界のKITTIで0.392 MMDを実現する。
論文 参考訳(メタデータ) (2023-01-11T16:14:12Z) - Semantic keypoint-based pose estimation from single RGB frames [64.80395521735463]
一つのRGB画像からオブジェクトの連続6-DoFポーズを推定する手法を提案する。
このアプローチは、畳み込みネットワーク(convnet)によって予測されるセマンティックキーポイントと、変形可能な形状モデルを組み合わせる。
提案手法は,インスタンスベースのシナリオとクラスベースのシナリオの両方に対して,6-DoFオブジェクトのポーズを正確に復元できることを示す。
論文 参考訳(メタデータ) (2022-04-12T15:03:51Z) - COTReg:Coupled Optimal Transport based Point Cloud Registration [28.730827908402286]
本稿では,3次元点雲登録の対応性を予測するための学習フレームワークCOTRegを提案する。
2つのマッチングをワッサーシュタイン距離ベースとグロモフ=ワッサーシュタイン距離ベース最適化に変換する。
我々の対応予測パイプラインは、FCGFのような学習ベースの機能やFPFHのような伝統的な記述子に簡単に統合できます。
論文 参考訳(メタデータ) (2021-12-29T03:20:18Z) - Deep Hough Voting for Robust Global Registration [52.40611370293272]
6次元変換パラメータ空間におけるハフ投票を利用した実世界の3Dスキャンのペア登録のための効率的なフレームワークを提案する。
提案手法は, 3DMatch と 3DLoMatch のベンチマークにおいて, KITTI odometry データセットで同等の性能を達成しながら, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-09-09T14:38:06Z) - U-mesh: Human Correspondence Matching with Mesh Convolutional Networks [15.828285556159026]
本稿では,パラメータテンプレートモデルを生の走査メッシュに適合させるために,レグレッション(ボトムアップ)と生成(トップダウン)のエレガントな融合を提案する。
最初の大きな貢献は、テンプレート表面への点対応を予測する固有の畳み込みメッシュU-netアーキテクチャである。
FAUST対応課題に対する提案手法の評価を行い,対象者間対応技術の現状を20%(33%)改善する方法について検討した。
論文 参考訳(メタデータ) (2021-08-15T08:58:45Z) - Shape My Face: Registering 3D Face Scans by Surface-to-Surface
Translation [75.59415852802958]
Shape-My-Face (SMF) は、改良されたポイントクラウドエンコーダ、新しい視覚的注意機構、スキップ接続付きグラフ畳み込みデコーダ、特殊口モデルに基づく強力なエンコーダデコーダアーキテクチャである。
私たちのモデルは、トポロジカルにサウンドメッシュを最小限の監視で提供し、より高速なトレーニング時間を提供し、訓練可能なパラメータを桁違いに減らし、ノイズに強く、以前は見られないデータセットに一般化することができます。
論文 参考訳(メタデータ) (2020-12-16T20:02:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。