論文の概要: FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled
Diffusion Model
- arxiv url: http://arxiv.org/abs/2311.12070v1
- Date: Sun, 19 Nov 2023 19:44:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 03:38:05.997166
- Title: FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled
Diffusion Model
- Title(参考訳): FDDM:周波数分離拡散モデルを用いた医用画像の教師なし翻訳
- Authors: Yunxiang Li, Hua-Chieh Shao, Xiaoxue Qian, You Zhang
- Abstract要約: 拡散モデルは、疾患の診断、局所化、治療を支援するために、医用画像翻訳のための高品質な画像を生成することができる。
本稿では,翻訳過程においてフーリエ領域の医用画像の周波数成分を分離する新しい枠組みを提案する。
- 参考スコア(独自算出の注目度): 2.482734802108685
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have demonstrated significant potential in producing
high-quality images for medical image translation to aid disease diagnosis,
localization, and treatment. Nevertheless, current diffusion models have
limited success in achieving faithful image translations that can accurately
preserve the anatomical structures of medical images, especially for unpaired
datasets. The preservation of structural and anatomical details is essential to
reliable medical diagnosis and treatment planning, as structural mismatches can
lead to disease misidentification and treatment errors. In this study, we
introduced a frequency-decoupled diffusion model (FDDM), a novel framework that
decouples the frequency components of medical images in the Fourier domain
during the translation process, to allow structure-preserved high-quality image
conversion. FDDM applies an unsupervised frequency conversion module to
translate the source medical images into frequency-specific outputs and then
uses the frequency-specific information to guide a following diffusion model
for final source-to-target image translation. We conducted extensive
evaluations of FDDM using a public brain MR-to-CT translation dataset, showing
its superior performance against other GAN-, VAE-, and diffusion-based models.
Metrics including the Frechet inception distance (FID), the peak
signal-to-noise ratio (PSNR), and the structural similarity index measure
(SSIM) were assessed. FDDM achieves an FID of 29.88, less than half of the
second best. These results demonstrated FDDM's prowess in generating
highly-realistic target-domain images while maintaining the faithfulness of
translated anatomical structures.
- Abstract(参考訳): 拡散モデルは、疾患の診断、局所化、治療を支援するために、医用画像翻訳のための高品質な画像を作成する大きな可能性を示している。
しかしながら、現在の拡散モデルは、医学画像の解剖学的構造を正確に保存できる忠実な画像翻訳、特に障害のないデータセットの達成に限られている。
構造的ミスマッチは疾患の誤認や治療ミスにつながるため、構造的および解剖学的詳細の保存は信頼できる診断と治療計画に不可欠である。
本研究では,フーリエ領域の医療画像の周波数成分を翻訳過程で分離し,構造保存された高品質画像変換を可能にする新しいフレームワークである周波数分解拡散モデル(fddm)を導入した。
FDDMは、教師なしの周波数変換モジュールを適用して、ソースの医用画像を周波数固有出力に変換し、その後、周波数固有情報を使用して、最終ソースからターゲットへの画像変換のための次の拡散モデルを導出する。
公開脳mriからctへの翻訳データセットを用いてfddmの広範な評価を行い,他のgan,vae,および拡散に基づくモデルよりも優れた性能を示した。
Frechet開始距離(FID)、ピーク信号-雑音比(PSNR)、構造類似度指標(SSIM)などの指標を評価した。
FDDMのFIDは29.88で、第2位の半分以下である。
これらの結果から,FDDMは,翻訳された解剖学的構造の忠実さを維持しつつ,高リアルなターゲットドメイン画像の生成に優れていた。
関連論文リスト
- VALD-MD: Visual Attribution via Latent Diffusion for Medical Diagnostics [0.0]
医用画像における視覚的属性は、医用画像の診断関連成分を明確にすることを目指している。
本稿では、潜在拡散モデルとドメイン固有大言語モデルを組み合わせた新しい生成的視覚属性手法を提案する。
結果として生じるシステムは、ゼロショット局所化疾患誘導を含む様々な潜在能力を示す。
論文 参考訳(メタデータ) (2024-01-02T19:51:49Z) - C^2M-DoT: Cross-modal consistent multi-view medical report generation
with domain transfer network [67.97926983664676]
ドメイン転送ネットワーク(C2M-DoT)を用いたクロスモーダルなマルチビュー医療レポート生成を提案する。
C2M-DoTは、すべてのメトリクスで最先端のベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-09T02:31:36Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Zero-shot Medical Image Translation via Frequency-Guided Diffusion
Models [9.15810015583615]
構造保存画像変換のための拡散モデルを導出するために周波数領域フィルタを用いた周波数誘導拡散モデル(FGDM)を提案する。
その設計に基づいて、FGDMはゼロショット学習を可能にし、ターゲットドメインのデータのみに基づいてトレーニングし、ソース・ツー・ターゲットドメインの変換に直接使用することができる。
FGDMは、Frechet Inception Distance(FID)、Peak Signal-to-Noise Ratio(PSNR)、および構造的類似性の測定値において、最先端手法(GANベース、VAEベース、拡散ベース)よりも優れていた
論文 参考訳(メタデータ) (2023-04-05T20:47:40Z) - Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。
提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。
われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文 参考訳(メタデータ) (2023-03-18T04:06:18Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - Unsupervised Medical Image Translation with Adversarial Diffusion Models [0.2770822269241974]
ソース・トゥ・ターゲット・モダリティ変換による画像の欠落の計算は、医用画像プロトコルの多様性を向上させることができる。
本稿では, 医用画像翻訳の性能向上のための逆拡散モデルであるSynDiffを提案する。
論文 参考訳(メタデータ) (2022-07-17T15:53:24Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Self-Attentive Spatial Adaptive Normalization for Cross-Modality Domain
Adaptation [9.659642285903418]
放射線科医の費用負担を軽減するための医用画像のクロスモダリティ合成
本稿では,教師なしまたは教師なし(非ペア画像データ)の設定が可能な医用画像における画像から画像への変換手法を提案する。
論文 参考訳(メタデータ) (2021-03-05T16:22:31Z) - Multi-institutional Collaborations for Improving Deep Learning-based
Magnetic Resonance Image Reconstruction Using Federated Learning [62.17532253489087]
深層学習法はmr画像再構成において優れた性能をもたらすことが示されている。
これらの方法は、高い取得コストと医療データプライバシー規制のために収集および共有が困難である大量のデータを必要とします。
我々は,異なる施設で利用可能なmrデータを活用し,患者のプライバシーを保ちながら,連合学習(fl)ベースのソリューションを提案する。
論文 参考訳(メタデータ) (2021-03-03T03:04:40Z) - Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion
Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。
SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。
また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文 参考訳(メタデータ) (2020-02-25T14:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。