論文の概要: WDM: 3D Wavelet Diffusion Models for High-Resolution Medical Image Synthesis
- arxiv url: http://arxiv.org/abs/2402.19043v2
- Date: Fri, 19 Jul 2024 09:42:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 23:47:06.658549
- Title: WDM: 3D Wavelet Diffusion Models for High-Resolution Medical Image Synthesis
- Title(参考訳): WDM:高分解能医用画像合成のための3次元ウェーブレット拡散モデル
- Authors: Paul Friedrich, Julia Wolleb, Florentin Bieder, Alicia Durrer, Philippe C. Cattin,
- Abstract要約: 本研究はウェーブレット画像に拡散モデルを適用するウェーブレットベースの医用画像合成フレームワークであるWDMを提案する。
BraTS と LIDC-IDRI の非条件画像生成実験の結果,FID (State-of-the-art image fidelity) とMS-SSIM (Simified diversity) のスコアが得られた。
提案手法は,高画質画像を256倍256倍256$の解像度で生成できる唯一の手法である。
- 参考スコア(独自算出の注目度): 1.647759094903376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the three-dimensional nature of CT- or MR-scans, generative modeling of medical images is a particularly challenging task. Existing approaches mostly apply patch-wise, slice-wise, or cascaded generation techniques to fit the high-dimensional data into the limited GPU memory. However, these approaches may introduce artifacts and potentially restrict the model's applicability for certain downstream tasks. This work presents WDM, a wavelet-based medical image synthesis framework that applies a diffusion model on wavelet decomposed images. The presented approach is a simple yet effective way of scaling 3D diffusion models to high resolutions and can be trained on a single \SI{40}{\giga\byte} GPU. Experimental results on BraTS and LIDC-IDRI unconditional image generation at a resolution of $128 \times 128 \times 128$ demonstrate state-of-the-art image fidelity (FID) and sample diversity (MS-SSIM) scores compared to recent GANs, Diffusion Models, and Latent Diffusion Models. Our proposed method is the only one capable of generating high-quality images at a resolution of $256 \times 256 \times 256$, outperforming all comparing methods.
- Abstract(参考訳): CTやMRスキャンの3次元的な性質から、医用画像の生成モデリングは特に難しい課題である。
既存のアプローチは、主にパッチワイド、スライスワイズ、カスケード生成技術を適用して、高次元データを限られたGPUメモリに適合させる。
しかし、これらのアプローチはアーティファクトを導入し、特定の下流タスクに対するモデルの適用性を制限する可能性がある。
本研究はウェーブレット分解画像に拡散モデルを適用するウェーブレットベースの医用画像合成フレームワークであるWDMを提案する。
提案したアプローチは、3D拡散モデルを高解像度にスケーリングするシンプルで効果的な方法であり、単一のSI{40}{\giga\byte} GPUでトレーニングすることができる。
128 \times 128 \times 128$の解像度でのBraTSとLIDC-IDRIの無条件画像生成実験は、最近のGAN、拡散モデル、潜時拡散モデルと比較して、最先端画像忠実度(FID)とサンプル多様性(MS-SSIM)のスコアを示す。
提案手法は,256 \times 256 \times 256$の解像度で高品質な画像を生成することができる唯一の方法である。
関連論文リスト
- cWDM: Conditional Wavelet Diffusion Models for Cross-Modality 3D Medical Image Synthesis [1.767791678320834]
本稿では「BraTS 2024脳MR画像合成チャレンジ」に貢献する。
高分解能ボリュームの対画像変換タスクを解くための条件付きウェーブレット拡散モデルを提案する。
論文 参考訳(メタデータ) (2024-11-26T08:17:57Z) - Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis [62.06970466554273]
SDXLのような最先端拡散モデルに匹敵するレベルまで、非自己回帰マスク型画像モデリング(MIM)のテキスト・ツー・イメージが増大するMeissonicを提案する。
高品質なトレーニングデータを活用し、人間の嗜好スコアから得られるマイクロ条件を統合し、特徴圧縮層を用いて画像の忠実度と解像度をさらに向上する。
我々のモデルは、高画質の高精細画像を生成する際に、SDXLのような既存のモデルに適合するだけでなく、しばしば性能を上回ります。
論文 参考訳(メタデータ) (2024-10-10T17:59:17Z) - MAISI: Medical AI for Synthetic Imaging [16.687814167558326]
医用画像解析は、データの不足、高アノテーションコスト、プライバシー上の懸念といった課題に直面している。
本稿では,合成画像のための医用AI(MAISI)を導入し,CT画像を生成する。
論文 参考訳(メタデータ) (2024-09-13T18:15:08Z) - SDXS: Real-Time One-Step Latent Diffusion Models with Image Conditions [5.100085108873068]
SDXS-512 と SDXS-1024 の2つのモデルを示し,1つのGPU上で約100 FPS (SD v1.5 より30倍速い) と30 FPS (SDXLより60倍速い) の推論速度を実現する。
我々のトレーニングアプローチは、画像条件付き制御に有望な応用を提供し、画像間の効率的な翻訳を容易にする。
論文 参考訳(メタデータ) (2024-03-25T11:16:23Z) - Latent Consistency Models: Synthesizing High-Resolution Images with
Few-Step Inference [60.32804641276217]
本稿では,LCM(Latent Consistency Models)を提案する。
高品質の768 x 768 24-step LCMは、トレーニングに32A100 GPU時間しかかからない。
また,画像データセットの微調整に適した新しいLCM法であるLCF(Latent Consistency Fine-tuning)についても紹介する。
論文 参考訳(メタデータ) (2023-10-06T17:11:58Z) - Memory-Efficient 3D Denoising Diffusion Models for Medical Image Processing [0.9424565541639366]
本稿では,3次元拡散モデルにおける資源消費の削減法について述べる。
本論文の主な貢献は,メモリ効率のパッチベース拡散モデルである。
提案した拡散モデルは,任意の画像生成タスクに適用できるが,BraTS 2020データセットの腫瘍セグメンテーションタスクについて評価する。
論文 参考訳(メタデータ) (2023-03-27T15:10:19Z) - On Distillation of Guided Diffusion Models [94.95228078141626]
そこで本研究では,分類器を含まない誘導拡散モデルから抽出し易いモデルへ抽出する手法を提案する。
画素空間上で訓練された標準拡散モデルに対して,本手法は元のモデルに匹敵する画像を生成することができる。
遅延空間で訓練された拡散モデル(例えば、安定拡散)に対して、我々の手法は1から4段階のデノナイジングステップで高忠実度画像を生成することができる。
論文 参考訳(メタデータ) (2022-10-06T18:03:56Z) - Cascaded Diffusion Models for High Fidelity Image Generation [53.57766722279425]
本研究では,画像ネット生成の課題に対して,カスケード拡散モデルを用いて高忠実度画像を生成可能であることを示す。
カスケード拡散モデルは、解像度が増大する画像を生成する複数の拡散モデルのパイプラインを含む。
その結果,カスケードパイプラインのサンプル品質は,条件付拡張に大きく依存していることがわかった。
論文 参考訳(メタデータ) (2021-05-30T17:14:52Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z) - Improved Techniques for Training Score-Based Generative Models [104.20217659157701]
本研究では,高次元空間におけるスコアモデルからの学習とサンプリングに関する新しい理論的解析を行う。
スコアベースの生成モデルを前例のない解像度で画像に拡張することができる。
我々のスコアベースモデルは、様々な画像データセットで最良クラスGANに匹敵する高忠実度サンプルを生成することができる。
論文 参考訳(メタデータ) (2020-06-16T09:17:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。