論文の概要: WDM: 3D Wavelet Diffusion Models for High-Resolution Medical Image
Synthesis
- arxiv url: http://arxiv.org/abs/2402.19043v1
- Date: Thu, 29 Feb 2024 11:11:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 15:13:52.398814
- Title: WDM: 3D Wavelet Diffusion Models for High-Resolution Medical Image
Synthesis
- Title(参考訳): WDM:高分解能医用画像合成のための3次元ウェーブレット拡散モデル
- Authors: Paul Friedrich, Julia Wolleb, Florentin Bieder, Alicia Durrer,
Philippe C. Cattin
- Abstract要約: 本研究はウェーブレット画像に拡散モデルを適用するウェーブレットベースの医用画像合成フレームワークであるWDMを提案する。
BraTS と LIDC-IDRI の非条件画像生成実験結果から,FID (State-of-the-art image fidelity) とMS-SSIM (Simified diversity) のスコアが得られた。
- 参考スコア(独自算出の注目度): 1.767791678320834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the three-dimensional nature of CT- or MR-scans, generative modeling
of medical images is a particularly challenging task. Existing approaches
mostly apply patch-wise, slice-wise, or cascaded generation techniques to fit
the high-dimensional data into the limited GPU memory. However, these
approaches may introduce artifacts and potentially restrict the model's
applicability for certain downstream tasks. This work presents WDM, a
wavelet-based medical image synthesis framework that applies a diffusion model
on wavelet decomposed images. The presented approach is a simple yet effective
way of scaling diffusion models to high resolutions and can be trained on a
single 40 GB GPU. Experimental results on BraTS and LIDC-IDRI unconditional
image generation at a resolution of $128 \times 128 \times 128$ show
state-of-the-art image fidelity (FID) and sample diversity (MS-SSIM) scores
compared to GANs, Diffusion Models, and Latent Diffusion Models. Our proposed
method is the only one capable of generating high-quality images at a
resolution of $256 \times 256 \times 256$.
- Abstract(参考訳): CTやMRスキャンの3次元的な性質から、医用画像の生成モデリングは特に難しい課題である。
既存のアプローチは、主にパッチワイド、スライスワイズ、あるいはカスケード生成技術を適用して、高次元データを限られたGPUメモリに適合させる。
しかし、これらのアプローチはアーティファクトを導入し、特定の下流タスクに対するモデルの適用性を制限する可能性がある。
本研究はウェーブレット分解画像に拡散モデルを適用するウェーブレットベースの医用画像合成フレームワークであるWDMを提案する。
提示されたアプローチは、拡散モデルを高解像度にスケールするシンプルかつ効果的な方法であり、単一の40gbgpuでトレーニングすることができる。
128 \times 128 \times 128$の解像度でBraTSとLIDC-IDRIの無条件画像生成実験の結果は、GAN、拡散モデル、潜時拡散モデルと比較して、最先端画像忠実度(FID)とサンプル多様性(MS-SSIM)のスコアを示した。
提案手法は,256 \times 256 \times 256$の解像度で高品質な画像を生成することができる唯一の方法である。
関連論文リスト
- A 3D generative model of pathological multi-modal MR images and
segmentations [3.4806591877889375]
脳MRIと関連セグメンテーションのための3次元生成モデルである脳SPADE3Dを提案する。
提案した共同画像分割生成モデルを用いて,高忠実度合成画像と関連するセグメンテーションを生成する。
データに予期せぬ病理が存在する場合、セグメント化モデルの性能に関する問題をモデルが緩和する方法を実証する。
論文 参考訳(メタデータ) (2023-11-08T09:36:37Z) - ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with
Diffusion Models [126.35334860896373]
本研究では,事前学習した拡散モデルから,トレーニング画像サイズよりもはるかに高解像度で画像を生成する能力について検討する。
注意ベースや共同拡散アプローチのような、高分解能な生成のための既存の研究は、これらの問題にうまく対処できない。
本稿では,推論中の畳み込み知覚場を動的に調整できる簡易かつ効果的な再拡張法を提案する。
論文 参考訳(メタデータ) (2023-10-11T17:52:39Z) - Latent Consistency Models: Synthesizing High-Resolution Images with
Few-Step Inference [60.32804641276217]
本稿では,LCM(Latent Consistency Models)を提案する。
高品質の768 x 768 24-step LCMは、トレーニングに32A100 GPU時間しかかからない。
また,画像データセットの微調整に適した新しいLCM法であるLCF(Latent Consistency Fine-tuning)についても紹介する。
論文 参考訳(メタデータ) (2023-10-06T17:11:58Z) - Diffusion Models for Memory-efficient Processing of 3D Medical Images [0.8388591755871734]
本稿では,3次元拡散モデルにおける資源消費の削減法について述べる。
本論文の主な貢献は,メモリ効率のパッチベース拡散モデルである。
提案した拡散モデルは,任意の画像生成タスクに適用できるが,BraTS 2020データセットの腫瘍セグメンテーションタスクについて評価する。
論文 参考訳(メタデータ) (2023-03-27T15:10:19Z) - Multitask Brain Tumor Inpainting with Diffusion Models: A Methodological
Report [0.0]
インペイントアルゴリズムは、入力画像の1つ以上の領域を変更することができるDL生成モデルのサブセットである。
これらのアルゴリズムの性能は、その限られた出力量のために、しばしば準最適である。
拡散確率モデル(DDPM)は、GANに匹敵する品質の結果を生成することができる、最近導入された生成ネットワークのファミリーである。
論文 参考訳(メタデータ) (2022-10-21T17:13:14Z) - On Distillation of Guided Diffusion Models [94.95228078141626]
そこで本研究では,分類器を含まない誘導拡散モデルから抽出し易いモデルへ抽出する手法を提案する。
画素空間上で訓練された標準拡散モデルに対して,本手法は元のモデルに匹敵する画像を生成することができる。
遅延空間で訓練された拡散モデル(例えば、安定拡散)に対して、我々の手法は1から4段階のデノナイジングステップで高忠実度画像を生成することができる。
論文 参考訳(メタデータ) (2022-10-06T18:03:56Z) - Cascaded Diffusion Models for High Fidelity Image Generation [53.57766722279425]
本研究では,画像ネット生成の課題に対して,カスケード拡散モデルを用いて高忠実度画像を生成可能であることを示す。
カスケード拡散モデルは、解像度が増大する画像を生成する複数の拡散モデルのパイプラインを含む。
その結果,カスケードパイプラインのサンプル品質は,条件付拡張に大きく依存していることがわかった。
論文 参考訳(メタデータ) (2021-05-30T17:14:52Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z) - Improved Techniques for Training Score-Based Generative Models [104.20217659157701]
本研究では,高次元空間におけるスコアモデルからの学習とサンプリングに関する新しい理論的解析を行う。
スコアベースの生成モデルを前例のない解像度で画像に拡張することができる。
我々のスコアベースモデルは、様々な画像データセットで最良クラスGANに匹敵する高忠実度サンプルを生成することができる。
論文 参考訳(メタデータ) (2020-06-16T09:17:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。