論文の概要: DDR-Net: Dividing and Downsampling Mixed Network for Diffeomorphic Image
Registration
- arxiv url: http://arxiv.org/abs/2105.11361v1
- Date: Mon, 24 May 2021 15:45:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 18:26:22.201934
- Title: DDR-Net: Dividing and Downsampling Mixed Network for Diffeomorphic Image
Registration
- Title(参考訳): ddr-net:division and downsampling mixed network for diffeomorphic image registration
- Authors: Ankita Joshi, Yi Hong
- Abstract要約: 既存のアプローチでは、オリジナルのイメージをダウンサンプルするか、基礎となる変換を近似するか、モデルサイズを縮小する。
画像情報の大部分を複数スケールで保存する分割・ダウンサンプリング混合登録ネットワーク(DDR-Net)を提案する。
この設計は、ネットワークの入力サイズとメモリコストを削減し、一方、グローバル情報とローカル情報を融合することにより、DDR-Netは粗いレベルと細かなレベルのアライメントを得る。
- 参考スコア(独自算出の注目度): 5.749044590090683
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep diffeomorphic registration faces significant challenges for
high-dimensional images, especially in terms of memory limits. Existing
approaches either downsample original images, or approximate underlying
transformations, or reduce model size. The information loss during the
approximation or insufficient model capacity is a hindrance to the registration
accuracy for high-dimensional images, e.g., 3D medical volumes. In this paper,
we propose a Dividing and Downsampling mixed Registration network (DDR-Net), a
general architecture that preserves most of the image information at multiple
scales. DDR-Net leverages the global context via downsampling the input and
utilizes the local details from divided chunks of the input images. This design
reduces the network input size and its memory cost; meanwhile, by fusing global
and local information, DDR-Net obtains both coarse-level and fine-level
alignments in the final deformation fields. We evaluate DDR-Net on three public
datasets, i.e., OASIS, IBSR18, and 3DIRCADB-01, and the experimental results
demonstrate our approach outperforms existing approaches.
- Abstract(参考訳): 深い微分型登録は、特にメモリ制限の観点から、高次元画像において重要な課題に直面している。
既存のアプローチでは、オリジナルイメージのサンプルダウンや、おおよその変換、あるいはモデルサイズを削減している。
近似や不十分なモデルのキャパシティにおける情報損失は、高次元画像(例えば3d医療データ)の登録精度の妨げとなる。
本稿では,画像情報のほとんどを複数のスケールで保存する汎用アーキテクチャであるddr-net(dispartment and downsampling mixed registration network)を提案する。
DDR-Netは、入力をダウンサンプリングすることでグローバルコンテキストを活用し、入力画像の分割チャンクからの局所的な詳細を利用する。
この設計は、ネットワークの入力サイズとメモリコストを削減し、一方、グローバル情報とローカル情報を融合することにより、DDR-Netは最終的な変形場の粗いレベルと細いレベルのアライメントを得る。
我々は3つの公開データセット(OASIS, IBSR18, 3DIRCADB-01)上でDDR-Netを評価し, 既存のアプローチよりも優れていることを示す。
関連論文リスト
- Swap-Net: A Memory-Efficient 2.5D Network for Sparse-View 3D Cone Beam CT Reconstruction [13.891441371598546]
プロジェクションの限られたセットから3次元コーンビーム計算トモグラフィ(CBCT)画像の再構成は、多くの画像応用において逆問題である。
本稿では,スパースビュー3次元CBCT画像再構成のためのメモリ効率2.5DネットワークであるSwap-Netを提案する。
論文 参考訳(メタデータ) (2024-09-29T08:36:34Z) - DDR: Exploiting Deep Degradation Response as Flexible Image Descriptor [54.90762380689283]
本稿では, 劣化条件の異なる画像深部特徴の変化を定量化するDDRについて述べる。
画像記述子としてのDDRの汎用性は,キー画像属性と強い相関関係がみられた。
DDRは、画像復元作業において効果的な教師なし学習目標として機能し、画像の劣化と単一画像の超解像において顕著な進歩をもたらす。
論文 参考訳(メタデータ) (2024-06-12T16:26:56Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - Anyview: Generalizable Indoor 3D Object Detection with Variable Frames [63.51422844333147]
我々は,AnyViewという新しい3D検出フレームワークを実用化するために提案する。
本手法は, 単純かつクリーンなアーキテクチャを用いて, 高い一般化性と高い検出精度を実現する。
論文 参考訳(メタデータ) (2023-10-09T02:15:45Z) - Scale Attention for Learning Deep Face Representation: A Study Against
Visual Scale Variation [69.45176408639483]
我々はスケール空間理論に頼って凸層を再構築する。
我々はSCale AttentioN Conv Neural Network(textbfSCAN-CNN)という新しいスタイルを構築した。
単発方式として、推論はマルチショット融合よりも効率的である。
論文 参考訳(メタデータ) (2022-09-19T06:35:04Z) - MDA-Net: Multi-Dimensional Attention-Based Neural Network for 3D Image
Segmentation [4.221871357181261]
マルチ次元アテンションネットワーク(MDA-Net)を提案し,スライスワイド,空間,チャネルワイドアテンションを効率よくU-Netネットワークに統合する。
MICCAI iSegおよびIBSRデータセット上のモデルを評価し、実験結果が既存の方法よりも一貫した改善を示した。
論文 参考訳(メタデータ) (2021-05-10T16:58:34Z) - Memory-efficient GAN-based Domain Translation of High Resolution 3D
Medical Images [0.15092198588928965]
GAN(Generative Adversarial Network)は大規模な3次元医療画像にはほとんど適用されない。
本研究は、未ペアドメイン翻訳を確立するためのマルチスケールパッチベースのGANアプローチを提案する。
ドメイン翻訳シナリオの評価は155x240x240の脳MRIと最大512x512x512の胸部CTで行う。
論文 参考訳(メタデータ) (2020-10-06T08:43:27Z) - Pose-Guided High-Resolution Appearance Transfer via Progressive Training [65.92031716146865]
前例のない画像解像度で、所定の参照外観をターゲットポーズに転送するためのポーズ誘導型外観伝達ネットワークを提案する。
我々のネットワークは、局所的な知覚喪失や局所的な識別など、密集した局所記述子を用いて詳細を精査する。
我々のモデルは高品質な画像を生成し、人間の衣服の移動などの有用な応用にさらに活用することができる。
論文 参考訳(メタデータ) (2020-08-27T03:18:44Z) - Learning 3D Human Shape and Pose from Dense Body Parts [117.46290013548533]
本研究では,3次元の人体形状を学習し,身体部分の密接な対応からポーズをとるために,分解・集約ネットワーク(DaNet)を提案する。
ローカルストリームからのメッセージは集約され、回転ベースのポーズの堅牢な予測が強化される。
提案手法は,Human3.6M,UP3D,COCO,3DPWを含む屋内および実世界のデータセットで検証される。
論文 参考訳(メタデータ) (2019-12-31T15:09:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。