論文の概要: DPCN++: Differentiable Phase Correlation Network for Versatile Pose
Registration
- arxiv url: http://arxiv.org/abs/2206.05707v1
- Date: Sun, 12 Jun 2022 10:00:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-15 09:35:30.111417
- Title: DPCN++: Differentiable Phase Correlation Network for Versatile Pose
Registration
- Title(参考訳): DPCN++:Versatile Pose Registrationのための微分位相相関ネットワーク
- Authors: Zexi Chen, Yiyi Liao, Haozhe Du, Haodong Zhang, Xuecheng Xu, Haojian
Lu, Rong Xiong, Yue Wang
- Abstract要約: 本稿では,世界規模で収束し,対応のない位相相関解法を提案する。
DCPN++は,2次元鳥眼視画像,3次元物体・シーン計測,医用画像など,入力モードが異なる幅広い登録タスクで評価される。
- 参考スコア(独自算出の注目度): 18.60311260250232
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pose registration is critical in vision and robotics. This paper focuses on
the challenging task of initialization-free pose registration up to 7DoF for
homogeneous and heterogeneous measurements. While recent learning-based methods
show promise using differentiable solvers, they either rely on heuristically
defined correspondences or are prone to local minima. We present a
differentiable phase correlation (DPC) solver that is globally convergent and
correspondence-free. When combined with simple feature extraction networks, our
general framework DPCN++ allows for versatile pose registration with arbitrary
initialization. Specifically, the feature extraction networks first learn dense
feature grids from a pair of homogeneous/heterogeneous measurements. These
feature grids are then transformed into a translation and scale invariant
spectrum representation based on Fourier transform and spherical radial
aggregation, decoupling translation and scale from rotation. Next, the
rotation, scale, and translation are independently and efficiently estimated in
the spectrum step-by-step using the DPC solver. The entire pipeline is
differentiable and trained end-to-end. We evaluate DCPN++ on a wide range of
registration tasks taking different input modalities, including 2D bird's-eye
view images, 3D object and scene measurements, and medical images. Experimental
results demonstrate that DCPN++ outperforms both classical and learning-based
baselines, especially on partially observed and heterogeneous measurements.
- Abstract(参考訳): ポーズ登録は視覚とロボット工学において重要である。
本稿では,同種および異種測定における7DoFまでの初期化自由ポーズ登録の課題に焦点を当てた。
近年の学習ベース手法では, 可微分解法を用いた有望性を示すが, ヒューリスティックに定義された対応に依存するか, 局所最小化に傾向がある。
本稿では,世界規模で収束し,対応しない微分位相相関法を提案する。
単純な特徴抽出ネットワークと組み合わせることで、汎用フレームワークDPCN++は任意の初期化による多目的ポーズ登録を可能にする。
具体的には、特徴抽出ネットワークは、まず、一対の均質/ヘテロゲネス測定から高密度特徴格子を学習する。
これらの特徴格子は、フーリエ変換と球状半径アグリゲーションに基づく変換およびスケール不変スペクトル表現に変換され、変換とスケールは回転から切り離される。
次に、DPCソルバを用いてスペクトル毎に、回転、スケール、翻訳を独立に、かつ効率的に推定する。
パイプライン全体が微分可能で、エンドツーエンドでトレーニングされる。
2d鳥の目視画像,3dオブジェクトとシーンの計測,医療画像など,さまざまな入力モダリティを持つ幅広い登録タスクでdcpn++を評価した。
実験により, DCPN++は古典的, 学習的ベースライン, 特に部分的に観察された, 不均一な測定において, 高い性能を示した。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Double-Shot 3D Shape Measurement with a Dual-Branch Network [14.749887303860717]
我々は、異なる構造光(SL)変調を処理するために、デュアルブランチ畳み込みニューラルネットワーク(CNN)-トランスフォーマーネットワーク(PDCNet)を提案する。
PDCNet内では、Transformerブランチを使用してフリンジイメージのグローバルな認識をキャプチャし、CNNブランチはスペックルイメージのローカル詳細を収集するように設計されている。
提案手法は, 自己生成データセット上で高精度な結果が得られる一方で, フランジオーダーの曖昧さを低減できることを示す。
論文 参考訳(メタデータ) (2024-07-19T10:49:26Z) - Multiway Point Cloud Mosaicking with Diffusion and Global Optimization [74.3802812773891]
マルチウェイポイントクラウドモザイクのための新しいフレームワーク(水曜日)を紹介する。
我々のアプローチの核心は、重複を識別し、注意点を洗練する学習されたペアワイズ登録アルゴリズムODINである。
4つの多種多様な大規模データセットを用いて、我々の手法は、全てのベンチマークにおいて大きなマージンで、最先端のペアとローテーションの登録結果を比較した。
論文 参考訳(メタデータ) (2024-03-30T17:29:13Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to CT Image Fusion [3.868072865207522]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Gappy local conformal auto-encoders for heterogeneous data fusion: in
praise of rigidity [6.1152340690876095]
本稿では,このタスクのためのマルチオートエンコーダニューラルネットワークアーキテクチャの形で,エンドツーエンドの計算パイプラインを提案する。
パイプラインへの入力はいくつかの部分的な観測の集合であり、その結果は全世界的に一貫した潜在空間となり、すべての測定を調和させる(剛性化、融合)。
簡単な2次元データセットから始まり、Wi-Fiのローカライゼーション問題へと進む。
論文 参考訳(メタデータ) (2023-12-20T16:18:51Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Explicit Correspondence Matching for Generalizable Neural Radiance
Fields [49.49773108695526]
本稿では,新たな未知のシナリオに一般化し,2つのソースビューで新規なビュー合成を行う新しいNeRF手法を提案する。
明瞭な対応マッチングは、異なるビュー上の3Dポイントの2次元投影でサンプリングされた画像特徴間のコサイン類似度と定量化される。
実験では,実験結果から得られたコサイン特徴の類似性と体積密度との間に強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-04-24T17:46:01Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Deep Phase Correlation for End-to-End Heterogeneous Sensor Measurements
Matching [12.93459392278491]
不均一なセンサ計測に適合するエンド・ツー・エンドのディープ位相相関ネットワーク(DPCN)を提案する。
主なコンポーネントは、学習可能な特徴抽出器にポーズエラーをバックプロパゲートする、微分可能な相関ベースの推定器である。
解釈可能なモデリングにより、ネットワークは軽量化され、より良い一般化が期待できる。
論文 参考訳(メタデータ) (2020-08-21T13:42:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。