論文の概要: Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN
- arxiv url: http://arxiv.org/abs/2008.01910v4
- Date: Mon, 12 Sep 2022 17:04:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-11-02 18:38:28.237446
- Title: Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN
- Title(参考訳): メモリ効率3D GANのための階層的補正トレーニング
- Authors: Li Sun, Junxiang Chen, Yanwu Xu, Mingming Gong, Ke Yu, Kayhan
Batmanghelich
- Abstract要約: 本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
- 参考スコア(独自算出の注目度): 52.851990439671475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Adversarial Networks (GAN) have many potential medical imaging
applications, including data augmentation, domain adaptation, and model
explanation. Due to the limited memory of Graphical Processing Units (GPUs),
most current 3D GAN models are trained on low-resolution medical images, these
models either cannot scale to high-resolution or are prone to patchy artifacts.
In this work, we propose a novel end-to-end GAN architecture that can generate
high-resolution 3D images. We achieve this goal by using different
configurations between training and inference. During training, we adopt a
hierarchical structure that simultaneously generates a low-resolution version
of the image and a randomly selected sub-volume of the high-resolution image.
The hierarchical design has two advantages: First, the memory demand for
training on high-resolution images is amortized among sub-volumes. Furthermore,
anchoring the high-resolution sub-volumes to a single low-resolution image
ensures anatomical consistency between sub-volumes. During inference, our model
can directly generate full high-resolution images. We also incorporate an
encoder with a similar hierarchical structure into the model to extract
features from the images. Experiments on 3D thorax CT and brain MRI demonstrate
that our approach outperforms state of the art in image generation. We also
demonstrate clinical applications of the proposed model in data augmentation
and clinical-relevant feature extraction.
- Abstract(参考訳): Generative Adversarial Networks (GAN) は、データ拡張、ドメイン適応、モデル説明など、多くの潜在的な医療画像アプリケーションを持っている。
グラフィック処理ユニット(gpu)のメモリが限られているため、現在の3d ganモデルのほとんどは低解像度の医療画像で訓練されている。
本稿では,高分解能3d画像を生成するための新しいganアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
学習中,低解像度画像とランダムに選択された高画質画像のサブボリュームを同時に生成する階層構造を採用する。
階層的設計には2つの利点がある: まず、高解像度画像のトレーニングに対するメモリ要求は、サブボリューム間で償却される。
さらに、高解像度サブボリュームを単一の低解像度画像に固定することで、サブボリューム間の解剖学的一貫性が保証される。
推論中、我々のモデルは完全な高解像度画像を直接生成できる。
また,同様の階層構造を持つエンコーダをモデルに組み込んで,画像から特徴を抽出する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
また,データ拡張および臨床関連特徴抽出における提案モデルの臨床的応用について述べる。
関連論文リスト
- Bringing together invertible UNets with invertible attention modules for memory-efficient diffusion models [0.0]
高次元医用データセットの拡散モデルのための1つのGPUメモリ効率トレーニングのための新しいアーキテクチャを提案する。
提案モデルは,非可逆アテンションモジュールを持つ非可逆UNetアーキテクチャを用いて構築される。
この新モデルは、多数の画像生成タスクに適用できるが、3D BraTS 2020データセットにそのメモリ効率を示す。
論文 参考訳(メタデータ) (2025-04-15T05:26:42Z) - Memory-Efficient 3D High-Resolution Medical Image Synthesis Using CRF-Guided GANs [47.873227167456136]
本稿では、条件付きランダムフィールド(CRF)を用いて依存関係をモデル化する、エンドツーエンドの新しいGANアーキテクチャを提案する。
私たちのアーキテクチャは、メモリ使用量が少なく、複雑さも少ないが、最先端のアーキテクチャよりも優れています。
論文 参考訳(メタデータ) (2025-03-13T21:31:15Z) - SuperNeRF-GAN: A Universal 3D-Consistent Super-Resolution Framework for Efficient and Enhanced 3D-Aware Image Synthesis [59.73403876485574]
本稿では,3次元連続超解像のための汎用フレームワークであるSuperNeRF-GANを提案する。
SuperNeRF-GANの重要な特徴は、NeRFベースの3D認識画像合成手法とのシームレスな統合である。
実験により, 提案手法の効率性, 3次元整合性, 品質が示された。
論文 参考訳(メタデータ) (2025-01-12T10:31:33Z) - A Unified Model for Compressed Sensing MRI Across Undersampling Patterns [69.19631302047569]
様々な計測アンサンプパターンと画像解像度に頑健な統合MRI再構成モデルを提案する。
我々のモデルは、拡散法よりも600$times$高速な推論で、最先端CNN(End-to-End VarNet)の4dBでSSIMを11%改善し、PSNRを4dB改善する。
論文 参考訳(メタデータ) (2024-10-05T20:03:57Z) - URCDM: Ultra-Resolution Image Synthesis in Histopathology [4.393805955844748]
Ultra-Resolution Cascaded Diffusion Models (URCDMs) は、すべての病理像を高分解能で合成することができる。
本手法は脳,乳腺,腎臓の組織からなる3つの異なるデータセットを用いて評価した。
URCDMは、訓練された評価器が実際の画像と区別できない様々な解像度の出力を一貫して生成する。
論文 参考訳(メタデータ) (2024-07-18T08:31:55Z) - Inter-slice Super-resolution of Magnetic Resonance Images by Pre-training and Self-supervised Fine-tuning [49.197385954021456]
臨床実践では、2次元磁気共鳴(MR)シーケンスが広く採用されている。個々の2次元スライスを積み重ねて3次元ボリュームを形成できるが、比較的大きなスライスススペーシングは可視化とその後の解析タスクに課題をもたらす可能性がある。
スライス間隔を低減するため,ディープラーニングに基づく超解像技術が広く研究されている。
現在のほとんどのソリューションは、教師付きトレーニングのために、かなりの数の高解像度と低解像度の画像を必要とするが、通常は現実のシナリオでは利用できない。
論文 参考訳(メタデータ) (2024-06-10T02:20:26Z) - Memory-efficient High-resolution OCT Volume Synthesis with Cascaded Amortized Latent Diffusion Models [48.87160158792048]
本稿では,高分解能CTボリュームをメモリ効率よく合成できるCA-LDM(Cascaded amortized Latent diffusion model)を提案する。
公開高解像度OCTデータセットを用いた実験により、我々の合成データは、既存の手法の能力を超越した、現実的な高解像度かつグローバルな特徴を持つことが示された。
論文 参考訳(メタデータ) (2024-05-26T10:58:22Z) - ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with
Diffusion Models [126.35334860896373]
本研究では,事前学習した拡散モデルから,トレーニング画像サイズよりもはるかに高解像度で画像を生成する能力について検討する。
注意ベースや共同拡散アプローチのような、高分解能な生成のための既存の研究は、これらの問題にうまく対処できない。
本稿では,推論中の畳み込み知覚場を動的に調整できる簡易かつ効果的な再拡張法を提案する。
論文 参考訳(メタデータ) (2023-10-11T17:52:39Z) - MedSyn: Text-guided Anatomy-aware Synthesis of High-Fidelity 3D CT Images [22.455833806331384]
本稿では,テキスト情報によって誘導される高品質な3次元肺CT画像を作成するための革新的な手法を提案する。
現在の最先端のアプローチは、低解像度の出力に限られており、放射線学レポートの豊富な情報を不活用している。
論文 参考訳(メタデータ) (2023-10-05T14:16:22Z) - Memory-Efficient 3D Denoising Diffusion Models for Medical Image Processing [0.9424565541639366]
本稿では,3次元拡散モデルにおける資源消費の削減法について述べる。
本論文の主な貢献は,メモリ効率のパッチベース拡散モデルである。
提案した拡散モデルは,任意の画像生成タスクに適用できるが,BraTS 2020データセットの腫瘍セグメンテーションタスクについて評価する。
論文 参考訳(メタデータ) (2023-03-27T15:10:19Z) - SOUP-GAN: Super-Resolution MRI Using Generative Adversarial Networks [9.201328999176402]
本稿では,GAN(Perceptual-tuned Generative Adversarial Network)を用いたSOUP-GANというフレームワークを提案する。
本モデルは,新しい3D SR技術として期待でき,臨床と研究の両方に応用できる可能性を示している。
論文 参考訳(メタデータ) (2021-06-04T16:59:23Z) - Modelling the Distribution of 3D Brain MRI using a 2D Slice VAE [66.63629641650572]
本研究では,2次元スライスVAEとガウスモデルを組み合わせた3次元MR脳の体積分布をモデル化する手法を提案する。
また,本研究では,脳解剖学に適合するセグメンテーションの精度を定量的に評価する新たなボリューム評価手法を提案する。
論文 参考訳(メタデータ) (2020-07-09T13:23:15Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。