Fugu-MT 論文翻訳(概要): FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled Diffusion Model

論文の概要: FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled Diffusion Model

arxiv url: http://arxiv.org/abs/2311.12070v1
Date: Sun, 19 Nov 2023 19:44:44 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-23 03:38:05.997166
Title: FDDM: Unsupervised Medical Image Translation with a Frequency-Decoupled Diffusion Model
Title（参考訳）: FDDM:周波数分離拡散モデルを用いた医用画像の教師なし翻訳
Authors: Yunxiang Li, Hua-Chieh Shao, Xiaoxue Qian, You Zhang
Abstract要約: 拡散モデルは、疾患の診断、局所化、治療を支援するために、医用画像翻訳のための高品質な画像を生成することができる。本稿では,翻訳過程においてフーリエ領域の医用画像の周波数成分を分離する新しい枠組みを提案する。
参考スコア（独自算出の注目度）: 2.482734802108685
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Diffusion models have demonstrated significant potential in producing high-quality images for medical image translation to aid disease diagnosis, localization, and treatment. Nevertheless, current diffusion models have limited success in achieving faithful image translations that can accurately preserve the anatomical structures of medical images, especially for unpaired datasets. The preservation of structural and anatomical details is essential to reliable medical diagnosis and treatment planning, as structural mismatches can lead to disease misidentification and treatment errors. In this study, we introduced a frequency-decoupled diffusion model (FDDM), a novel framework that decouples the frequency components of medical images in the Fourier domain during the translation process, to allow structure-preserved high-quality image conversion. FDDM applies an unsupervised frequency conversion module to translate the source medical images into frequency-specific outputs and then uses the frequency-specific information to guide a following diffusion model for final source-to-target image translation. We conducted extensive evaluations of FDDM using a public brain MR-to-CT translation dataset, showing its superior performance against other GAN-, VAE-, and diffusion-based models. Metrics including the Frechet inception distance (FID), the peak signal-to-noise ratio (PSNR), and the structural similarity index measure (SSIM) were assessed. FDDM achieves an FID of 29.88, less than half of the second best. These results demonstrated FDDM's prowess in generating highly-realistic target-domain images while maintaining the faithfulness of translated anatomical structures.
Abstract（参考訳）: 拡散モデルは、疾患の診断、局所化、治療を支援するために、医用画像翻訳のための高品質な画像を作成する大きな可能性を示している。しかしながら、現在の拡散モデルは、医学画像の解剖学的構造を正確に保存できる忠実な画像翻訳、特に障害のないデータセットの達成に限られている。構造的ミスマッチは疾患の誤認や治療ミスにつながるため、構造的および解剖学的詳細の保存は信頼できる診断と治療計画に不可欠である。本研究では,フーリエ領域の医療画像の周波数成分を翻訳過程で分離し,構造保存された高品質画像変換を可能にする新しいフレームワークである周波数分解拡散モデル(fddm)を導入した。 FDDMは、教師なしの周波数変換モジュールを適用して、ソースの医用画像を周波数固有出力に変換し、その後、周波数固有情報を使用して、最終ソースからターゲットへの画像変換のための次の拡散モデルを導出する。公開脳mriからctへの翻訳データセットを用いてfddmの広範な評価を行い,他のgan,vae,および拡散に基づくモデルよりも優れた性能を示した。 Frechet開始距離(FID)、ピーク信号-雑音比(PSNR)、構造類似度指標(SSIM)などの指標を評価した。 FDDMのFIDは29.88で、第2位の半分以下である。これらの結果から,FDDMは,翻訳された解剖学的構造の忠実さを維持しつつ,高リアルなターゲットドメイン画像の生成に優れていた。

関連論文リスト

Generation of Chest CT pulmonary Nodule Images by Latent Diffusion Models using the LIDC-IDRI Dataset [0.0]
臨床では,特定の症例に対して大量のCT画像を集めることは困難である。潜在拡散モデル(LDM)を用いた入力テキストに基づく胸部CT結節画像の自動生成手法を提案する。評価の結果,提案手法は特定の医学的特徴を捉えた高品質な画像を生成することができた。
論文参考訳（メタデータ） (2026-01-16T08:36:12Z)
Lesion-Aware Post-Training of Latent Diffusion Models for Synthesizing Diffusion MRI from CT Perfusion [12.777937532267105]
ラテント拡散モデル(LDMs)は圧縮されたラテント空間における効率的な学習を活用する。この効率性にはトレードオフがあり、重要なピクセルレベルの詳細を妥協させる可能性がある。本稿では, 画像から画像への変換において, 病変対応の医用画素空間の目的を取り入れた, LDMの新たなトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2025-10-10T06:51:27Z)
EqDiff-CT: Equivariant Conditional Diffusion model for CT Image Synthesis from CBCT [43.92108185590778]
画像誘導放射線療法(IGRT)に広く用いられているコーンビームCT(CBCT) CBCTから高品質なCT画像を生成するために,EqDiff-CTという新しい拡散型条件生成モデルを提案する。
論文参考訳（メタデータ） (2025-09-26T05:51:59Z)
Direct Dual-Energy CT Material Decomposition using Model-based Denoising Diffusion Model [105.95160543743984]
本稿では,Dual-Energy Decomposition Model-based Diffusion (DEcomp-MoD) と呼ばれる深層学習手法を提案する。 Decomp-MoDは、教師なしスコアベースモデルと教師なしディープラーニングネットワークより優れていることを示す。
論文参考訳（メタデータ） (2025-07-24T01:00:06Z)
DMCIE: Diffusion Model with Concatenation of Inputs and Errors to Improve the Accuracy of the Segmentation of Brain Tumors in MRI Images [0.9374652839580183]
DMCIE(Diffusion Model with Concatenation of Inputs and Errors)を提案する。我々は3次元U-Netを用いて初期セグメンテーションマスクを生成し、そこから予測と基底真理の差を識別して誤差マップを生成する。マルチモーダルMRI入力(T1,T1ce,T2,FLAIR)を用いて、DMCIEは、元の入力で導かれる誤分類領域に着目して、セグメント化精度を効果的に向上する。
論文参考訳（メタデータ） (2025-07-01T17:34:50Z)
Diffusion Bridge Models for 3D Medical Image Translation [15.751276389741877]
本稿では,T1w MRIとDTIモダリティ間の3次元脳画像変換のための拡散ブリッジモデルを提案する。我々のモデルは、T1w画像から高品質なDTI分画異方性画像を生成することを学習し、その逆も実現し、モダリティデータの増大を可能にする。
論文参考訳（メタデータ） (2025-04-21T17:49:06Z)
Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文参考訳（メタデータ） (2025-04-20T01:54:18Z)
Translation of Fetal Brain Ultrasound Images into Pseudo-MRI Images using Artificial Intelligence [0.0]
第3三期では、胎児の脳の複雑さは定量的データを抽出するために高い画像品質を必要とする。対照的に、MRI(MRI)は優れた画像品質と組織分化を提供するが、利用できなく、高価であり、時間を要する。
論文参考訳（メタデータ） (2025-04-03T08:59:33Z)
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文参考訳（メタデータ） (2024-12-30T01:59:34Z)
Cross-conditioned Diffusion Model for Medical Image to Image Translation [22.020931436223204]
医用画像から画像への変換のためのクロスコンディショニング拡散モデル(CDM)を提案する。まず、目的のモダリティの分布をモデル化するためのモダリティ固有表現モデル(MRM)を提案する。そして、MDN(Modality-Decoupled Diffusion Network)を設計し、MRMから効率よく効果的に分布を学習する。
論文参考訳（メタデータ） (2024-09-13T02:48:56Z)
Similarity-aware Syncretic Latent Diffusion Model for Medical Image Translation with Representation Learning [15.234393268111845]
非造影CT(non-contrast CT)は画像のコントラストと解剖学的視認性を低下させ、診断の不確実性を増大させる可能性がある。医用画像翻訳のための潜時拡散モデルに基づく新しいシンプレティック生成モデル(S$2$LDM)を提案する。 S$2$LDMは、シンプレティックエンコーディングと拡散を通じて、異なるモーダル画像の類似性を高め、潜伏空間における重複情報を促進し、対照的に強調された領域でより詳細な医療画像を生成する。
論文参考訳（メタデータ） (2024-06-20T03:54:41Z)
DPER: Diffusion Prior Driven Neural Representation for Limited Angle and Sparse View CT Reconstruction [45.00528216648563]
Diffusion Prior Driven Neural Representation (DPER) は、異常に不適切なCT再構成逆問題に対処するために設計された、教師なしのフレームワークである。 DPERは、半二次分割法(HQS)アルゴリズムを採用し、逆問題からデータ忠実度とサブプロブレム前の分布に分解する。 LACTにおけるDPERの性能評価と2つの公開データセットを用いた超SVCT再構成に関する総合的な実験を行った。
論文参考訳（メタデータ） (2024-04-27T12:55:13Z)
Beyond Images: An Integrative Multi-modal Approach to Chest X-Ray Report Generation [47.250147322130545]
画像からテキストまでの放射線学レポート生成は,医療画像の発見を記述した放射線学レポートを自動生成することを目的としている。既存の方法の多くは画像データのみに焦点をあてており、他の患者情報は放射線科医に公開されていない。胸部X線レポートを生成するための多モードディープニューラルネットワークフレームワークを,非構造的臨床ノートとともにバイタルサインや症状などの構造化された患者データを統合することで提案する。
論文参考訳（メタデータ） (2023-11-18T14:37:53Z)
EMIT-Diff: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model [4.057796755073023]
EMIT-Diffと呼ばれる医用画像合成のための制御可能な拡散モデルを開発した。近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。提案手法では, 合成試料が医療上の制約に適合することを確実にする。
論文参考訳（メタデータ） (2023-10-19T16:18:02Z)
LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。 55の公開データセットから約13万の医療画像を収集しました。 LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文参考訳（メタデータ） (2023-06-20T22:21:34Z)
Zero-shot Medical Image Translation via Frequency-Guided Diffusion Models [9.15810015583615]
構造保存画像変換のための拡散モデルを導出するために周波数領域フィルタを用いた周波数誘導拡散モデル(FGDM)を提案する。その設計に基づいて、FGDMはゼロショット学習を可能にし、ターゲットドメインのデータのみに基づいてトレーニングし、ソース・ツー・ターゲットドメインの変換に直接使用することができる。 FGDMは、Frechet Inception Distance(FID)、Peak Signal-to-Noise Ratio(PSNR)、および構造的類似性の測定値において、最先端手法(GANベース、VAEベース、拡散ベース)よりも優れていた
論文参考訳（メタデータ） (2023-04-05T20:47:40Z)
Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文参考訳（メタデータ） (2023-03-18T04:06:18Z)
InDuDoNet+: A Model-Driven Interpretable Dual Domain Network for Metal Artifact Reduction in CT Images [53.4351366246531]
InDuDoNet+と呼ばれる新しい解釈可能な二重ドメインネットワークを構築し、CT画像の微細な埋め込みを行う。異なる組織間のCT値を分析し,InDuDoNet+の事前観測ネットワークにマージすることで,その一般化性能を著しく向上させる。
論文参考訳（メタデータ） (2021-12-23T15:52:37Z)
Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文参考訳（メタデータ） (2021-02-26T02:29:30Z)
A Multi-Stage Attentive Transfer Learning Framework for Improving COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文参考訳（メタデータ） (2021-01-14T01:39:19Z)
Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文参考訳（メタデータ） (2020-10-14T16:50:50Z)
Multifold Acceleration of Diffusion MRI via Slice-Interleaved Diffusion Encoding (SIDE) [50.65891535040752]
本稿では,Slice-Interleaved Diffusionと呼ばれる拡散符号化方式を提案する。 SIDEは、拡散重み付き(DW)画像ボリュームを異なる拡散勾配で符号化したスライスでインターリーブする。また,高いスライスアンサンプデータからDW画像を効果的に再構成するためのディープラーニングに基づく手法を提案する。
論文参考訳（メタデータ） (2020-02-25T14:48:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。