論文の概要: Dual-Stream Pyramid Registration Network
- arxiv url: http://arxiv.org/abs/1909.11966v2
- Date: Sat, 1 Apr 2023 11:28:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-05 02:36:44.660127
- Title: Dual-Stream Pyramid Registration Network
- Title(参考訳): デュアルストリームピラミッド登録ネットワーク
- Authors: Miao Kang and Xiaojun Hu and Weilin Huang and Matthew R. Scott and
Mauricio Reyes
- Abstract要約: 本稿では,教師なし3次元医用画像登録のためのDual-Stream Pyramid Registration Network(Dual-PRNet)を提案する。
畳み込み特徴ピラミッドからマルチスケールの登録フィールドを計算できる2ストリームアーキテクチャを設計する。
提案したDual-PRNetは、脳MRI登録のための2つの標準ベンチマークで評価されている。
- 参考スコア(独自算出の注目度): 34.65021683954268
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a Dual-Stream Pyramid Registration Network (referred as
Dual-PRNet) for unsupervised 3D medical image registration. Unlike recent
CNN-based registration approaches, such as VoxelMorph, which explores a
single-stream encoder-decoder network to compute a registration fields from a
pair of 3D volumes, we design a two-stream architecture able to compute
multi-scale registration fields from convolutional feature pyramids. Our
contributions are two-fold: (i) we design a two-stream 3D encoder-decoder
network which computes two convolutional feature pyramids separately for a pair
of input volumes, resulting in strong deep representations that are meaningful
for deformation estimation; (ii) we propose a pyramid registration module able
to predict multi-scale registration fields directly from the decoding feature
pyramids. This allows it to refine the registration fields gradually in a
coarse-to-fine manner via sequential warping, and enable the model with the
capability for handling significant deformations between two volumes, such as
large displacements in spatial domain or slice space. The proposed Dual-PRNet
is evaluated on two standard benchmarks for brain MRI registration, where it
outperforms the state-of-the-art approaches by a large margin, e.g., having
improvements over recent VoxelMorph [2] with 0.683->0.778 on the LPBA40, and
0.511->0.631 on the Mindboggle101, in term of average Dice score. Code is
available at: https://github.com/kangmiao15/Dual-Stream-PRNet-Plus.
- Abstract(参考訳): 本稿では,教師なし3次元医用画像登録のためのDual-Stream Pyramid Registration Network(Dual-PRNet)を提案する。
最近のCNNベースの登録手法とは異なり、VoxelMorphは1ストリームエンコーダ・デコーダネットワークを用いて、一対の3Dボリュームから登録フィールドを計算し、畳み込み特徴ピラミッドからマルチスケール登録フィールドを計算できる2ストリームアーキテクチャを設計する。
私たちの貢献は2つあります。
一) 2つの畳み込み特徴ピラミッドを1対の入力ボリュームで別々に計算し、変形推定に有意な強い深み表現を生成する2つのストリーム3dエンコーダ・デコーダネットワークを設計する。
(ii)デコーディング機能ピラミッドから直接,複数スケールの登録フィールドを予測できるピラミッド登録モジュールを提案する。
これにより、シーケンシャルなワープにより、登録フィールドを徐々に粗い方法で洗練し、空間領域やスライス空間における大きな変位などの2つのボリューム間の大きな変形を処理することができる。
提案されたDual-PRNetは脳MRI登録のための2つの標準ベンチマークで評価されており、例えば最近のVoxelMorph [2]のLPBA40では0.683->0.778、Mindboggle101では0.511->0.631に改善されている。
コードはhttps://github.com/kangmiao15/dual-stream-prnet-plusで入手できる。
関連論文リスト
- Efficient Transformer Encoders for Mask2Former-style models [57.54752243522298]
ECO-M2Fは、入力画像上に条件付きエンコーダ内の隠蔽層数を自己選択する戦略である。
提案手法は、性能を維持しながら、予測エンコーダの計算コストを削減する。
アーキテクチャ構成では柔軟性があり、セグメンテーションタスクを超えてオブジェクト検出まで拡張できる。
論文 参考訳(メタデータ) (2024-04-23T17:26:34Z) - Pyramid Attention Network for Medical Image Registration [4.142556531859984]
変形可能な医用画像登録のためのピラミッドアテンションネットワーク(PAN)を提案する。
PANはデュアルストリームピラミッドエンコーダをチャネルワイドで組み込んで特徴表現を強化している。
提案手法は,複数のCNNベースおよびTransformerベース登録ネットワークの性能を向上しつつ,良好な登録性能を実現する。
論文 参考訳(メタデータ) (2024-02-14T08:46:18Z) - RoCNet: 3D Robust Registration of Point-Clouds using Deep Learning [5.494111035517598]
本稿では,ディープラーニングに基づく3Dポイントクラウド登録手法を提案する。
我々はModelNet40データセットで実験を行い、提案したアーキテクチャは非常に有望な結果を示した。
論文 参考訳(メタデータ) (2023-03-14T15:07:51Z) - Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud
Pre-training [56.81809311892475]
Masked Autoencoders (MAE) は、言語と2次元画像変換器の自己教師付き事前学習において大きな可能性を示している。
我々は3次元点雲の階層的自己教師型学習のための強力なマルチスケールMAE事前学習フレームワークであるPoint-M2AEを提案する。
論文 参考訳(メタデータ) (2022-05-28T11:22:53Z) - A Volumetric Transformer for Accurate 3D Tumor Segmentation [25.961484035609672]
本稿では,医療画像セグメンテーションのためのトランスフォーマーアーキテクチャを提案する。
TransformerはU字型のボリュームエンコーダデコーダ設計で、入力ボクセル全体を処理している。
モデルがデータセット間でより良い表現を転送し、データの破損に対して堅牢であることを示します。
論文 参考訳(メタデータ) (2021-11-26T02:49:51Z) - Subpixel object segmentation using wavelets and multi resolution
analysis [4.970364068620608]
本稿では,2次元単純連結領域の境界を高速に予測するための新しいディープラーニングフレームワークを提案する。
境界は、ウェーブレットといわゆるピラミッドアルゴリズムを用いて(部分的に)滑らかな閉曲線としてモデル化される。
我々のモデルは、DiceスコアとHausdorff距離の点で同様の性能を維持しながら、U-Netと比較して最大5倍高速な推論速度を示す。
論文 参考訳(メタデータ) (2021-10-28T15:43:21Z) - PlueckerNet: Learn to Register 3D Line Reconstructions [57.20244406275875]
本稿では,ユークリッド空間における2つの部分重畳された3次元線再構成の問題をニューラルネットワークで解く手法を提案する。
室内および屋外の両方のデータセットを用いた実験により,本手法の登録精度(回転と翻訳)は,ベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-12-02T11:31:56Z) - DeepGMR: Learning Latent Gaussian Mixture Models for Registration [113.74060941036664]
ポイントクラウドの登録は、3Dコンピュータビジョン、グラフィックス、ロボット工学の基本的な問題である。
本稿では,最初の学習ベース登録法であるDeep Gaussian Mixture Registration(DeepGMR)を紹介する。
提案手法は,最先端の幾何学的および学習的登録手法と比較して,良好な性能を示す。
論文 参考訳(メタデータ) (2020-08-20T17:25:16Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Encoder-Decoder Based Convolutional Neural Networks with
Multi-Scale-Aware Modules for Crowd Counting [6.893512627479196]
正確かつ効率的な群集カウントのための2つの修正ニューラルネットワークを提案する。
最初のモデルはM-SFANetと名付けられ、アラス空間ピラミッドプール(ASPP)とコンテキスト認識モジュール(CAN)が付属している。
第2のモデルはM-SegNetと呼ばれ、SFANetの双線形アップサンプリングをSegNetで使用される最大アンプールに置き換えることで生成される。
論文 参考訳(メタデータ) (2020-03-12T03:00:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。