論文の概要: 3D MedDiffusion: A 3D Medical Diffusion Model for Controllable and High-quality Medical Image Generation
- arxiv url: http://arxiv.org/abs/2412.13059v1
- Date: Tue, 17 Dec 2024 16:25:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 13:57:27.324371
- Title: 3D MedDiffusion: A 3D Medical Diffusion Model for Controllable and High-quality Medical Image Generation
- Title(参考訳): 3次元メドディフュージョン:制御可能な高品質な医用画像生成のための3次元医用拡散モデル
- Authors: Haoshen Wang, Zhentao Liu, Kaicong Sun, Xiaodong Wang, Dinggang Shen, Zhiming Cui,
- Abstract要約: 制御可能な高品質な3次元医用画像生成のための3Dメディカルディフュージョン(3Dメドディフュージョン)モデル
3D MedDiffusionは、パッチワイドエンコーディングによって医療画像を潜在空間に圧縮する、新しくて高効率なPatch-Volume Autoencoderを組み込んでいる。
3D MedDiffusion は, 再生品質において最先端の手法を超越し, スパースビューCT再構成, 高速MRI再構成, データ拡張などのタスクに強い一般化性を示すことを示す。
- 参考スコア(独自算出の注目度): 47.701856217173244
- License:
- Abstract: The generation of medical images presents significant challenges due to their high-resolution and three-dimensional nature. Existing methods often yield suboptimal performance in generating high-quality 3D medical images, and there is currently no universal generative framework for medical imaging. In this paper, we introduce the 3D Medical Diffusion (3D MedDiffusion) model for controllable, high-quality 3D medical image generation. 3D MedDiffusion incorporates a novel, highly efficient Patch-Volume Autoencoder that compresses medical images into latent space through patch-wise encoding and recovers back into image space through volume-wise decoding. Additionally, we design a new noise estimator to capture both local details and global structure information during diffusion denoising process. 3D MedDiffusion can generate fine-detailed, high-resolution images (up to 512x512x512) and effectively adapt to various downstream tasks as it is trained on large-scale datasets covering CT and MRI modalities and different anatomical regions (from head to leg). Experimental results demonstrate that 3D MedDiffusion surpasses state-of-the-art methods in generative quality and exhibits strong generalizability across tasks such as sparse-view CT reconstruction, fast MRI reconstruction, and data augmentation.
- Abstract(参考訳): 医用画像の生成は、高解像度で3次元的な性質のため、大きな課題を呈している。
既存の方法では、高品質な3次元医用画像の生成において、最適以下の性能が得られることが多く、医用画像の普遍的な生成フレームワークは存在しない。
本稿では,制御可能な高品質な3次元医用画像生成のための3次元医療拡散(3D MedDiffusion)モデルを提案する。
3D MedDiffusionは、パッチワイドエンコーディングによって医療画像を潜在空間に圧縮し、ボリュームワイドデコーディングによって画像空間に復元する、新しくて高効率なPatch-Volume Autoencoderを組み込んでいる。
さらに,拡散復調過程における局所的詳細情報と大域的構造情報の両方をキャプチャする新しいノイズ推定器を設計する。
3D MedDiffusionは、細かな高解像度画像(最大512x512x512)を生成し、CTとMRIのモダリティと異なる解剖学的領域(頭から脚まで)をカバーする大規模なデータセットでトレーニングされた様々な下流タスクに効果的に適応することができる。
実験により, 3次元メドディフュージョンは, 生成品質における最先端の手法を超越し, スパースCT再構成, 高速MRI再構成, データ拡張などのタスクに強い一般化性を示すことが示された。
関連論文リスト
- MRI Reconstruction with Regularized 3D Diffusion Model (R3DM) [2.842800539489865]
正規化3次元拡散モデルと最適化手法を組み合わせた3次元MRI再構成法を提案する。
拡散に基づく事前処理を取り入れることで,画像品質の向上,ノイズの低減,3次元MRI再構成の全体的な忠実度の向上を実現した。
論文 参考訳(メタデータ) (2024-12-25T00:55:05Z) - 3D-CT-GPT: Generating 3D Radiology Reports through Integration of Large Vision-Language Models [51.855377054763345]
本稿では,VQAに基づく医用視覚言語モデルである3D-CT-GPTについて紹介する。
パブリックデータセットとプライベートデータセットの両方の実験により、3D-CT-GPTはレポートの正確さと品質という点で既存の手法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-09-28T12:31:07Z) - Diff3Dformer: Leveraging Slice Sequence Diffusion for Enhanced 3D CT Classification with Transformer Networks [5.806035963947936]
拡散型3次元視覚変換器(Diff3Dformer)を提案する。
本手法は, 肺CTの2種類の小さなデータセットに対して, 改良された性能を示す。
論文 参考訳(メタデータ) (2024-06-24T23:23:18Z) - X-Diffusion: Generating Detailed 3D MRI Volumes From a Single Image Using Cross-Sectional Diffusion Models [6.046082223332061]
X-拡散(X-Diffusion)は、空間領域入力から詳細な3次元MRIボリュームを再構成する新しい断面積拡散モデルである。
X-Diffusionの重要な側面は、MRIデータを横断的なトレーニングと推論の間、全体的な3Dボリュームとしてモデル化することである。
以上の結果から,X-Diffusionは定量精度(PSNR)に優れるだけでなく,重要な解剖学的特徴を保っていることが示唆された。
論文 参考訳(メタデータ) (2024-04-30T14:53:07Z) - Super-resolution of biomedical volumes with 2D supervision [84.5255884646906]
超解像のための仮設スライス拡散は、生物学的標本のすべての空間次元にわたるデータ生成分布の固有同値性を利用する。
我々は,高解像度2次元画像の高速取得を特徴とするSliceRの組織学的刺激(SRH)への応用に着目する。
論文 参考訳(メタデータ) (2024-04-15T02:41:55Z) - Generative Enhancement for 3D Medical Images [74.17066529847546]
本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。
本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。
3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2024-03-19T15:57:04Z) - Improving 3D Imaging with Pre-Trained Perpendicular 2D Diffusion Models [52.529394863331326]
本稿では,2つの垂直2次元拡散モデルを用いて3次元逆問題の解法を提案する。
MRI Z軸超解像, 圧縮センシングMRI, スパースCTなどの3次元医用画像再構成作業に有効である。
論文 参考訳(メタデータ) (2023-03-15T08:28:06Z) - Medical Transformer: Universal Brain Encoder for 3D MRI Analysis [1.6287500717172143]
既存の3Dベースの手法は、トレーニング済みのモデルを下流のタスクに転送している。
彼らは3D医療イメージングのためのモデルを訓練するために大量のパラメータを要求します。
本稿では,2次元画像スライス形式で3次元容積画像を効果的にモデル化する,メディカルトランスフォーマーと呼ばれる新しい伝達学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-28T08:34:21Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。