Fugu-MT 論文翻訳(概要): FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled Diffusion Model

論文の概要: FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled Diffusion Model

arxiv url: http://arxiv.org/abs/2311.12070v2
Date: Thu, 27 Jun 2024 00:45:18 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-28 20:06:29.675603
Title: FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled Diffusion Model
Title（参考訳）: FDDM:周波数分離拡散モデルを用いた医用画像の教師なし翻訳
Authors: Yunxiang Li, Hua-Chieh Shao, Xiaoxue Qian, You Zhang,
Abstract要約: MR-CT変換のための周波数分離拡散モデルを提案する。我々のモデルは低周波・高周波情報に二重経路逆拡散法を用いる。翻訳された解剖学的構造の精度を維持しつつ、高品質なターゲットドメイン画像を生成することができる。
参考スコア（独自算出の注目度）: 2.2726755789556794
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Diffusion models have demonstrated significant potential in producing high-quality images in medical image translation to aid disease diagnosis, localization, and treatment. Nevertheless, current diffusion models have limited success in achieving faithful image translations that can accurately preserve the anatomical structures of medical images, especially for unpaired datasets. The preservation of structural and anatomical details is essential to reliable medical diagnosis and treatment planning, as structural mismatches can lead to disease misidentification and treatment errors. In this study, we introduce the Frequency Decoupled Diffusion Model (FDDM) for MR-to-CT conversion. FDDM first obtains the anatomical information of the CT image from the MR image through an initial conversion module. This anatomical information then guides a subsequent diffusion model to generate high-quality CT images. Our diffusion model uses a dual-path reverse diffusion process for low-frequency and high-frequency information, achieving a better balance between image quality and anatomical accuracy. We extensively evaluated FDDM using public datasets for brain MR-to-CT and pelvis MR-to-CT translations, demonstrating its superior performance to other GAN-based, VAE-based, and diffusion-based models. The evaluation metrics included Frechet Inception Distance (FID), Peak Signal-to-Noise Ratio (PSNR), and Structural Similarity Index Measure (SSIM). FDDM achieved the best scores on all metrics for both datasets, particularly excelling in FID, with scores of 25.9 for brain data and 29.2 for pelvis data, significantly outperforming other methods. These results demonstrate that FDDM can generate high-quality target domain images while maintaining the accuracy of translated anatomical structures.
Abstract（参考訳）: 拡散モデルは、疾患の診断、局所化、治療を支援するために、医用画像翻訳において高品質な画像を生成する大きな可能性を示している。しかしながら、現在の拡散モデルは、医学画像の解剖学的構造を正確に保存できる忠実な画像翻訳、特に障害のないデータセットの達成に限定して成功している。構造的ミスマッチは疾患の誤認や治療ミスにつながるため、構造的および解剖学的詳細の保存は信頼性の高い診断と治療計画に不可欠である。本研究では,MR-CT変換のための周波数デカップリング拡散モデル(FDDM)を提案する。 FDDMは、まず、初期変換モジュールを介してMR画像からCT画像の解剖情報を取得する。この解剖学的情報は、その後の拡散モデルをガイドし、高品質なCT画像を生成する。我々の拡散モデルは、低周波・高周波情報にデュアルパス逆拡散法を用い、画像品質と解剖学的精度のバランスを良くする。脳MR-to-CTおよび骨盤MR-to-CT翻訳のための公開データセットを用いてFDDMを広範囲に評価し、他のGANベース、VAEベース、拡散ベースモデルよりも優れた性能を示した。評価指標はFrechet Inception Distance (FID), Peak Signal-to-Noise Ratio (PSNR), Structure similarity Index Measure (SSIM)であった。 FDDMは両方のデータセット、特にFIDで優れ、脳データでは25.9点、骨盤データでは29.2点、その他の手法では著しく優れていた。これらの結果は、FDDMが翻訳された解剖学的構造の精度を維持しつつ、高品質なターゲットドメイン画像を生成することができることを示している。

関連論文リスト

Generation of Chest CT pulmonary Nodule Images by Latent Diffusion Models using the LIDC-IDRI Dataset [0.0]
臨床では,特定の症例に対して大量のCT画像を集めることは困難である。潜在拡散モデル(LDM)を用いた入力テキストに基づく胸部CT結節画像の自動生成手法を提案する。評価の結果,提案手法は特定の医学的特徴を捉えた高品質な画像を生成することができた。
論文参考訳（メタデータ） (2026-01-16T08:36:12Z)
Lesion-Aware Post-Training of Latent Diffusion Models for Synthesizing Diffusion MRI from CT Perfusion [12.777937532267105]
ラテント拡散モデル(LDMs)は圧縮されたラテント空間における効率的な学習を活用する。この効率性にはトレードオフがあり、重要なピクセルレベルの詳細を妥協させる可能性がある。本稿では, 画像から画像への変換において, 病変対応の医用画素空間の目的を取り入れた, LDMの新たなトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2025-10-10T06:51:27Z)
EqDiff-CT: Equivariant Conditional Diffusion model for CT Image Synthesis from CBCT [43.92108185590778]
画像誘導放射線療法(IGRT)に広く用いられているコーンビームCT(CBCT) CBCTから高品質なCT画像を生成するために,EqDiff-CTという新しい拡散型条件生成モデルを提案する。
論文参考訳（メタデータ） (2025-09-26T05:51:59Z)
Direct Dual-Energy CT Material Decomposition using Model-based Denoising Diffusion Model [105.95160543743984]
本稿では,Dual-Energy Decomposition Model-based Diffusion (DEcomp-MoD) と呼ばれる深層学習手法を提案する。 Decomp-MoDは、教師なしスコアベースモデルと教師なしディープラーニングネットワークより優れていることを示す。
論文参考訳（メタデータ） (2025-07-24T01:00:06Z)
DMCIE: Diffusion Model with Concatenation of Inputs and Errors to Improve the Accuracy of the Segmentation of Brain Tumors in MRI Images [0.9374652839580183]
DMCIE(Diffusion Model with Concatenation of Inputs and Errors)を提案する。我々は3次元U-Netを用いて初期セグメンテーションマスクを生成し、そこから予測と基底真理の差を識別して誤差マップを生成する。マルチモーダルMRI入力(T1,T1ce,T2,FLAIR)を用いて、DMCIEは、元の入力で導かれる誤分類領域に着目して、セグメント化精度を効果的に向上する。
論文参考訳（メタデータ） (2025-07-01T17:34:50Z)
Diffusion Bridge Models for 3D Medical Image Translation [15.751276389741877]
本稿では,T1w MRIとDTIモダリティ間の3次元脳画像変換のための拡散ブリッジモデルを提案する。我々のモデルは、T1w画像から高品質なDTI分画異方性画像を生成することを学習し、その逆も実現し、モダリティデータの増大を可能にする。
論文参考訳（メタデータ） (2025-04-21T17:49:06Z)
Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文参考訳（メタデータ） (2025-04-20T01:54:18Z)
Translation of Fetal Brain Ultrasound Images into Pseudo-MRI Images using Artificial Intelligence [0.0]
第3三期では、胎児の脳の複雑さは定量的データを抽出するために高い画像品質を必要とする。対照的に、MRI(MRI)は優れた画像品質と組織分化を提供するが、利用できなく、高価であり、時間を要する。
論文参考訳（メタデータ） (2025-04-03T08:59:33Z)
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文参考訳（メタデータ） (2024-12-30T01:59:34Z)
Cross-conditioned Diffusion Model for Medical Image to Image Translation [22.020931436223204]
医用画像から画像への変換のためのクロスコンディショニング拡散モデル(CDM)を提案する。まず、目的のモダリティの分布をモデル化するためのモダリティ固有表現モデル(MRM)を提案する。そして、MDN(Modality-Decoupled Diffusion Network)を設計し、MRMから効率よく効果的に分布を学習する。
論文参考訳（メタデータ） (2024-09-13T02:48:56Z)
Similarity-aware Syncretic Latent Diffusion Model for Medical Image Translation with Representation Learning [15.234393268111845]
非造影CT(non-contrast CT)は画像のコントラストと解剖学的視認性を低下させ、診断の不確実性を増大させる可能性がある。医用画像翻訳のための潜時拡散モデルに基づく新しいシンプレティック生成モデル(S$2$LDM)を提案する。 S$2$LDMは、シンプレティックエンコーディングと拡散を通じて、異なるモーダル画像の類似性を高め、潜伏空間における重複情報を促進し、対照的に強調された領域でより詳細な医療画像を生成する。
論文参考訳（メタデータ） (2024-06-20T03:54:41Z)
DPER: Diffusion Prior Driven Neural Representation for Limited Angle and Sparse View CT Reconstruction [45.00528216648563]
Diffusion Prior Driven Neural Representation (DPER) は、異常に不適切なCT再構成逆問題に対処するために設計された、教師なしのフレームワークである。 DPERは、半二次分割法(HQS)アルゴリズムを採用し、逆問題からデータ忠実度とサブプロブレム前の分布に分解する。 LACTにおけるDPERの性能評価と2つの公開データセットを用いた超SVCT再構成に関する総合的な実験を行った。
論文参考訳（メタデータ） (2024-04-27T12:55:13Z)
Beyond Images: An Integrative Multi-modal Approach to Chest X-Ray Report Generation [47.250147322130545]
画像からテキストまでの放射線学レポート生成は,医療画像の発見を記述した放射線学レポートを自動生成することを目的としている。既存の方法の多くは画像データのみに焦点をあてており、他の患者情報は放射線科医に公開されていない。胸部X線レポートを生成するための多モードディープニューラルネットワークフレームワークを,非構造的臨床ノートとともにバイタルサインや症状などの構造化された患者データを統合することで提案する。
論文参考訳（メタデータ） (2023-11-18T14:37:53Z)
EMIT-Diff: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model [4.057796755073023]
EMIT-Diffと呼ばれる医用画像合成のための制御可能な拡散モデルを開発した。近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。提案手法では, 合成試料が医療上の制約に適合することを確実にする。
論文参考訳（メタデータ） (2023-10-19T16:18:02Z)
LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。 55の公開データセットから約13万の医療画像を収集しました。 LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文参考訳（メタデータ） (2023-06-20T22:21:34Z)
Zero-shot Medical Image Translation via Frequency-Guided Diffusion Models [9.15810015583615]
構造保存画像変換のための拡散モデルを導出するために周波数領域フィルタを用いた周波数誘導拡散モデル(FGDM)を提案する。その設計に基づいて、FGDMはゼロショット学習を可能にし、ターゲットドメインのデータのみに基づいてトレーニングし、ソース・ツー・ターゲットドメインの変換に直接使用することができる。 FGDMは、Frechet Inception Distance(FID)、Peak Signal-to-Noise Ratio(PSNR)、および構造的類似性の測定値において、最先端手法(GANベース、VAEベース、拡散ベース)よりも優れていた
論文参考訳（メタデータ） (2023-04-05T20:47:40Z)
Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文参考訳（メタデータ） (2023-03-18T04:06:18Z)
InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文参考訳（メタデータ） (2021-12-23T15:52:37Z)
Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文参考訳（メタデータ） (2021-02-26T02:29:30Z)
A Multi-Stage Attentive Transfer Learning Framework for Improving COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文参考訳（メタデータ） (2021-01-14T01:39:19Z)
Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文参考訳（メタデータ） (2020-10-14T16:50:50Z)
Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。 SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文参考訳（メタデータ） (2020-02-25T14:48:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。