論文の概要: FCaS: Fine-grained Cardiac Image Synthesis based on 3D Template Conditional Diffusion Model
- arxiv url: http://arxiv.org/abs/2503.09560v1
- Date: Wed, 12 Mar 2025 17:25:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:38:40.146396
- Title: FCaS: Fine-grained Cardiac Image Synthesis based on 3D Template Conditional Diffusion Model
- Title(参考訳): FCaS:3次元テンプレート条件拡散モデルに基づく細粒度心画像合成
- Authors: Jiahao Xia, Yutao Hu, Yaolei Qi, Zhenliang Li, Wenqi Shao, Junjun He, Ying Fu, Longjiang Zhang, Guanyu Yang,
- Abstract要約: 本稿では,3次元テンプレート条件付き拡散モデル上に構築された細粒度心臓画像合成フレームワークを提案する。
FCaSはテンプレート誘導条件拡散モデル(TCDM)を用いた正確な心構造生成を実現する
本稿では,不正確な合成画像による混乱を軽減するために,信頼を意識した適応学習(CAL)戦略を提案する。
- 参考スコア(独自算出の注目度): 23.9686884119236
- License:
- Abstract: Solving medical imaging data scarcity through semantic image generation has attracted significant attention in recent years. However, existing methods primarily focus on generating whole-organ or large-tissue structures, showing limited effectiveness for organs with fine-grained structure. Due to stringent topological consistency, fragile coronary features, and complex 3D morphological heterogeneity in cardiac imaging, accurately reconstructing fine-grained anatomical details of the heart remains a great challenge. To address this problem, in this paper, we propose the Fine-grained Cardiac image Synthesis(FCaS) framework, established on 3D template conditional diffusion model. FCaS achieves precise cardiac structure generation using Template-guided Conditional Diffusion Model (TCDM) through bidirectional mechanisms, which provides the fine-grained topological structure information of target image through the guidance of template. Meanwhile, we design a deformable Mask Generation Module (MGM) to mitigate the scarcity of high-quality and diverse reference mask in the generation process. Furthermore, to alleviate the confusion caused by imprecise synthetic images, we propose a Confidence-aware Adaptive Learning (CAL) strategy to facilitate the pre-training of downstream segmentation tasks. Specifically, we introduce the Skip-Sampling Variance (SSV) estimation to obtain confidence maps, which are subsequently employed to rectify the pre-training on downstream tasks. Experimental results demonstrate that images generated from FCaS achieves state-of-the-art performance in topological consistency and visual quality, which significantly facilitates the downstream tasks as well. Code will be released in the future.
- Abstract(参考訳): 近年,セマンティック画像生成による医用画像データの不足の解消が注目されている。
しかし、既存の手法は主に組織全体や大きな組織構造の生成に重点を置いており、微細な構造を持つ臓器に対する効果は限られていた。
厳密なトポロジカルな整合性, 脆弱な冠動脈の特徴, 心臓画像における複雑な3次元形態的不均一性により, 微細な解剖学的細部を正確に再構築することは大きな課題である。
そこで本研究では,3次元テンプレート条件拡散モデル上に構築された細粒度カルディアック画像合成(FCaS)フレームワークを提案する。
FCaSは、テンプレート誘導条件拡散モデル(TCDM)を用いて、双方向メカニズムにより正確な心構造生成を実現し、テンプレートの誘導により、ターゲット画像の微細なトポロジ的構造情報を提供する。
一方, 変形可能なマスク生成モジュール (MGM) を設計し, 生成プロセスにおける高品質で多様な参照マスクの不足を軽減する。
さらに,不正確な合成画像による混乱を軽減するために,下流セグメンテーションタスクの事前学習を容易にする信頼度対応型適応学習(CAL)戦略を提案する。
具体的には、Skip-Sampling Variance (SSV) 推定を導入し、信頼性マップを得る。
実験により,FCaSから生成した画像はトポロジカルな整合性と視覚的品質において最先端のパフォーマンスを実現し,下流のタスクも大幅に促進されることが示された。
コードは将来的にリリースされる予定だ。
関連論文リスト
- DiffDoctor: Diagnosing Image Diffusion Models Before Treating [57.82359018425674]
DiffDoctorは2段階のパイプラインで、画像拡散モデルがより少ないアーティファクトを生成するのを支援する。
我々は100万以上の欠陥のある合成画像のデータセットを収集し、効率的なHuman-in-the-loopアノテーションプロセスを構築した。
次に、学習したアーティファクト検出器が第2段階に関与し、ピクセルレベルのフィードバックを提供することで拡散モデルを最適化する。
論文 参考訳(メタデータ) (2025-01-21T18:56:41Z) - Image Synthesis with Class-Aware Semantic Diffusion Models for Surgical Scene Segmentation [3.6723640056915436]
本稿では,データ不足と不均衡に対処するクラスアウェア意味拡散モデル(CASDM)を提案する。
クラス認識平均二乗誤差とクラス認識自己認識損失関数は、重要で目立たないクラスを優先するように定義されている。
我々は、テキストプロンプトを用いて、その内容を特定するために、初めて、新しい方法でマルチクラスセグメンテーションマップを生成する。
論文 参考訳(メタデータ) (2024-10-31T14:14:30Z) - Explicit Differentiable Slicing and Global Deformation for Cardiac Mesh Reconstruction [8.730291904586656]
医用画像からの心臓解剖のメッシュ再構築は, 形状, 運動計測, 生体物理シミュレーションに有用である。
従来のボクセルベースのアプローチは、イメージの忠実さを損なう前処理と後処理に依存している。
そこで本稿では,メッシュのスライスからメッシュへの勾配バックプロパゲーションを可能にする,新しい識別可能なボキセル化とスライシング(DVS)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-03T17:19:31Z) - Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis [65.7968515029306]
PGPIS(Pose-Guided Person Image Synthesis)のためのCFLD(Coarse-to-Fine Latent Diffusion)法を提案する。
認識修正デコーダは、学習可能なクエリの集合を段階的に洗練し、粗いプロンプトとして人物画像の意味的理解を抽出するように設計されている。
論文 参考訳(メタデータ) (2024-02-28T06:07:07Z) - MedSyn: Text-guided Anatomy-aware Synthesis of High-Fidelity 3D CT Images [22.455833806331384]
本稿では,テキスト情報によって誘導される高品質な3次元肺CT画像を作成するための革新的な手法を提案する。
現在の最先端のアプローチは、低解像度の出力に限られており、放射線学レポートの豊富な情報を不活用している。
論文 参考訳(メタデータ) (2023-10-05T14:16:22Z) - Disruptive Autoencoders: Leveraging Low-level features for 3D Medical
Image Pre-training [51.16994853817024]
本研究は、3Dラジオグラフィ画像のための効果的な事前学習フレームワークの設計に焦点をあてる。
ローカルマスキングと低レベルの摂動の組み合わせによって生成された破壊から、オリジナルのイメージを再構築しようとする事前トレーニングフレームワークであるDisruptive Autoencodersを紹介する。
提案する事前トレーニングフレームワークは、複数のダウンストリームタスクでテストされ、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-07-31T17:59:42Z) - Pathology Synthesis of 3D-Consistent Cardiac MR Images using 2D VAEs and
GANs [0.5039813366558306]
本稿では,教師付きディープラーニング(DL)トレーニングの適用のためのラベル付きデータを生成する手法を提案する。
画像合成はラベル変形とラベルから画像への変換からなる。
心臓MRI画像のデータベースを多様化・拡張する手法として,このようなアプローチが有効であることを示す。
論文 参考訳(メタデータ) (2022-09-09T10:17:49Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Explainable multiple abnormality classification of chest CT volumes with
AxialNet and HiResCAM [89.2175350956813]
本稿では,容積医用画像における多変量分類の課題について紹介する。
本稿では,複数のインスタンス学習型畳み込みニューラルネットワークであるAxialNetを提案する。
そして、HiResCAMと3D許容領域を利用した新しいマスクロスにより、モデルの学習を改善することを目指す。
論文 参考訳(メタデータ) (2021-11-24T01:14:33Z) - Synthetic Generation of Three-Dimensional Cancer Cell Models from
Histopathological Images [19.778965983551114]
本論文では,発電機識別パターンに基づく合成3次元ヒストロジーモデル生成のための新しい枠組みを提案する。
提案アルゴリズムは、低いフリーチェット・インセプションスコアなどの比較評価指標において、高い定量的および定性的な合成を実現する。
論文 参考訳(メタデータ) (2021-01-26T14:00:00Z) - Hierarchical Amortized Training for Memory-efficient High Resolution 3D
GAN [52.851990439671475]
本稿では,高解像度な3D画像を生成することができる新しいエンドツーエンドGANアーキテクチャを提案する。
トレーニングと推論の異なる構成を使用することで、この目標を達成する。
3次元胸郭CTと脳MRIの実験により、我々のアプローチは画像生成における最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-05T02:33:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。