論文の概要: DPCN++: Differentiable Phase Correlation Network for Versatile Pose
Registration
- arxiv url: http://arxiv.org/abs/2206.05707v1
- Date: Sun, 12 Jun 2022 10:00:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-15 09:35:30.111417
- Title: DPCN++: Differentiable Phase Correlation Network for Versatile Pose
Registration
- Title(参考訳): DPCN++:Versatile Pose Registrationのための微分位相相関ネットワーク
- Authors: Zexi Chen, Yiyi Liao, Haozhe Du, Haodong Zhang, Xuecheng Xu, Haojian
Lu, Rong Xiong, Yue Wang
- Abstract要約: 本稿では,世界規模で収束し,対応のない位相相関解法を提案する。
DCPN++は,2次元鳥眼視画像,3次元物体・シーン計測,医用画像など,入力モードが異なる幅広い登録タスクで評価される。
- 参考スコア(独自算出の注目度): 18.60311260250232
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pose registration is critical in vision and robotics. This paper focuses on
the challenging task of initialization-free pose registration up to 7DoF for
homogeneous and heterogeneous measurements. While recent learning-based methods
show promise using differentiable solvers, they either rely on heuristically
defined correspondences or are prone to local minima. We present a
differentiable phase correlation (DPC) solver that is globally convergent and
correspondence-free. When combined with simple feature extraction networks, our
general framework DPCN++ allows for versatile pose registration with arbitrary
initialization. Specifically, the feature extraction networks first learn dense
feature grids from a pair of homogeneous/heterogeneous measurements. These
feature grids are then transformed into a translation and scale invariant
spectrum representation based on Fourier transform and spherical radial
aggregation, decoupling translation and scale from rotation. Next, the
rotation, scale, and translation are independently and efficiently estimated in
the spectrum step-by-step using the DPC solver. The entire pipeline is
differentiable and trained end-to-end. We evaluate DCPN++ on a wide range of
registration tasks taking different input modalities, including 2D bird's-eye
view images, 3D object and scene measurements, and medical images. Experimental
results demonstrate that DCPN++ outperforms both classical and learning-based
baselines, especially on partially observed and heterogeneous measurements.
- Abstract(参考訳): ポーズ登録は視覚とロボット工学において重要である。
本稿では,同種および異種測定における7DoFまでの初期化自由ポーズ登録の課題に焦点を当てた。
近年の学習ベース手法では, 可微分解法を用いた有望性を示すが, ヒューリスティックに定義された対応に依存するか, 局所最小化に傾向がある。
本稿では,世界規模で収束し,対応しない微分位相相関法を提案する。
単純な特徴抽出ネットワークと組み合わせることで、汎用フレームワークDPCN++は任意の初期化による多目的ポーズ登録を可能にする。
具体的には、特徴抽出ネットワークは、まず、一対の均質/ヘテロゲネス測定から高密度特徴格子を学習する。
これらの特徴格子は、フーリエ変換と球状半径アグリゲーションに基づく変換およびスケール不変スペクトル表現に変換され、変換とスケールは回転から切り離される。
次に、DPCソルバを用いてスペクトル毎に、回転、スケール、翻訳を独立に、かつ効率的に推定する。
パイプライン全体が微分可能で、エンドツーエンドでトレーニングされる。
2d鳥の目視画像,3dオブジェクトとシーンの計測,医療画像など,さまざまな入力モダリティを持つ幅広い登録タスクでdcpn++を評価した。
実験により, DCPN++は古典的, 学習的ベースライン, 特に部分的に観察された, 不均一な測定において, 高い性能を示した。
関連論文リスト
- Deep Homography Estimation for Visual Place Recognition [51.70437924779968]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Fully Differentiable Correlation-driven 2D/3D Registration for X-ray to
CT Image Fusion [4.1498463236541605]
画像ベース剛性2D/3Dレジストレーションは, 蛍光ガイド下外科手術において重要な技術である。
デュアルブランチCNN変換器エンコーダを用いた完全微分型相関型ネットワークを提案する。
組込み情報に基づく低周波特徴と高周波特徴の分解に対して相関型損失を提案する。
論文 参考訳(メタデータ) (2024-02-04T14:12:51Z) - Gappy local conformal auto-encoders for heterogeneous data fusion: in
praise of rigidity [6.1152340690876095]
本稿では,このタスクのためのマルチオートエンコーダニューラルネットワークアーキテクチャの形で,エンドツーエンドの計算パイプラインを提案する。
パイプラインへの入力はいくつかの部分的な観測の集合であり、その結果は全世界的に一貫した潜在空間となり、すべての測定を調和させる(剛性化、融合)。
簡単な2次元データセットから始まり、Wi-Fiのローカライゼーション問題へと進む。
論文 参考訳(メタデータ) (2023-12-20T16:18:51Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Explicit Correspondence Matching for Generalizable Neural Radiance
Fields [49.49773108695526]
本稿では,新たな未知のシナリオに一般化し,2つのソースビューで新規なビュー合成を行う新しいNeRF手法を提案する。
明瞭な対応マッチングは、異なるビュー上の3Dポイントの2次元投影でサンプリングされた画像特徴間のコサイン類似度と定量化される。
実験では,実験結果から得られたコサイン特徴の類似性と体積密度との間に強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-04-24T17:46:01Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Deep Phase Correlation for End-to-End Heterogeneous Sensor Measurements
Matching [12.93459392278491]
不均一なセンサ計測に適合するエンド・ツー・エンドのディープ位相相関ネットワーク(DPCN)を提案する。
主なコンポーネントは、学習可能な特徴抽出器にポーズエラーをバックプロパゲートする、微分可能な相関ベースの推定器である。
解釈可能なモデリングにより、ネットワークは軽量化され、より良い一般化が期待できる。
論文 参考訳(メタデータ) (2020-08-21T13:42:25Z) - Multimodality Biomedical Image Registration using Free Point Transformer
Networks [0.37501702548174964]
本稿では,新しい自由点変換器(FPT)ネットワークに基づく点集合登録アルゴリズムについて述べる。
FPTは、大域的特徴抽出器で構築され、未順序のソースと可変サイズのターゲットポイントセットを受け入れる。
前立腺MRIとスパース取得超音波画像を用いたマルチモーダル登録タスクにおいて、FPTは同等または改善された結果を得る。
論文 参考訳(メタデータ) (2020-08-05T00:13:04Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。