論文の概要: Pyramid Hierarchical Masked Diffusion Model for Imaging Synthesis
- arxiv url: http://arxiv.org/abs/2507.16579v1
- Date: Tue, 22 Jul 2025 13:30:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:14.136412
- Title: Pyramid Hierarchical Masked Diffusion Model for Imaging Synthesis
- Title(参考訳): 画像合成のためのピラミッド階層型マスク付き拡散モデル
- Authors: Xiaojiao Xiao, Qinmin Vivian Hu, Guanghui Wang,
- Abstract要約: 本稿では,新しい画像合成ネットワークであるピラミッド階層型マスケッド拡散モデル(PHMDiff)を提案する。
2つの挑戦的データセットの実験により、PHMDiffはPak Signal-to-Noise Ratio(PSNR)とStructure similarity Index Measure(SSIM)の両方で優れた性能を発揮することが示された。
医療画像モダリティの多次元画像合成フレームワークであるPHMDiffモデルは,他の手法に比べて大きな優位性を示している。
- 参考スコア(独自算出の注目度): 6.475175425060296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image synthesis plays a crucial role in clinical workflows, addressing the common issue of missing imaging modalities due to factors such as extended scan times, scan corruption, artifacts, patient motion, and intolerance to contrast agents. The paper presents a novel image synthesis network, the Pyramid Hierarchical Masked Diffusion Model (PHMDiff), which employs a multi-scale hierarchical approach for more detailed control over synthesizing high-quality images across different resolutions and layers. Specifically, this model utilizes randomly multi-scale high-proportion masks to speed up diffusion model training, and balances detail fidelity and overall structure. The integration of a Transformer-based Diffusion model process incorporates cross-granularity regularization, modeling the mutual information consistency across each granularity's latent spaces, thereby enhancing pixel-level perceptual accuracy. Comprehensive experiments on two challenging datasets demonstrate that PHMDiff achieves superior performance in both the Peak Signal-to-Noise Ratio (PSNR) and Structural Similarity Index Measure (SSIM), highlighting its capability to produce high-quality synthesized images with excellent structural integrity. Ablation studies further confirm the contributions of each component. Furthermore, the PHMDiff model, a multi-scale image synthesis framework across and within medical imaging modalities, shows significant advantages over other methods. The source code is available at https://github.com/xiaojiao929/PHMDiff
- Abstract(参考訳): 医用画像合成は臨床ワークフローにおいて重要な役割を担い、スキャン時間の延長、スキャンの腐敗、人工物、患者の動き、コントラストエージェントに対する不寛容などの要因による画像モダリティの欠如の一般的な問題に対処する。
画像合成ネットワークであるPyramid Hierarchical Masked Diffusion Model (PHMDiff)を提案する。
具体的には、ランダムに多スケールの高確率マスクを用いて拡散モデルのトレーニングを高速化し、詳細な忠実度と全体構造のバランスをとる。
Transformerをベースとした拡散モデルプロセスの統合は、粒度の正則化を取り入れ、各粒度の潜在空間間での相互情報の整合性をモデル化し、ピクセルレベルの知覚精度を向上させる。
2つの挑戦的なデータセットに関する総合的な実験により、PHMDiffはPak Signal-to-Noise Ratio (PSNR)とStructure similarity Index Measure (SSIM)の両方で優れた性能を発揮し、優れた構造整合性を持つ高品質な合成画像を作成する能力を強調した。
アブレーション研究は、各コンポーネントの貢献をさらに確認する。
さらに、医療画像モダリティの多次元画像合成フレームワークであるPHMDiffモデルは、他の手法に比べて大きな優位性を示している。
ソースコードはhttps://github.com/xiaojiao929/PHMDiffで入手できる。
関連論文リスト
- MedDiff-FT: Data-Efficient Diffusion Model Fine-tuning with Structural Guidance for Controllable Medical Image Synthesis [19.36433173105439]
MedDiff-FTは、拡散基盤モデルを微調整して、構造的依存性と領域特異性を持つ医用画像を生成する、制御可能な医用画像生成法である。
このフレームワークは、生成品質、多様性、計算効率を効果的にバランスさせ、医療データ拡張のための実用的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-07-01T02:22:32Z) - Improving Progressive Generation with Decomposable Flow Matching [50.63174319509629]
Decomposable Flow Matching (DFM)は、ビジュアルメディアのプログレッシブな生成のためのシンプルで効果的なフレームワークである。
Imagenet-1k 512pxでは、DFMはベースアーキテクチャよりも35.2%改善され、ベースラインは26.4%向上した。
論文 参考訳(メタデータ) (2025-06-24T17:58:02Z) - Bi-modality medical images synthesis by a bi-directional discrete process matching method [2.7309692684728617]
本稿では,二方向離散プロセスマッチング(Bi-DPM)というフローベースモデルを提案する。
Bi-DPMは、他の最先端のフローベースのバイモーダリティ画像合成法よりも優れており、正確な解剖学的領域で高い画質を実現する。
論文 参考訳(メタデータ) (2024-09-06T01:54:35Z) - DiffBoost: Enhancing Medical Image Segmentation via Text-Guided Diffusion Model [3.890243179348094]
医療応用のための堅牢で成功したディープラーニングモデルを開発するためには、大規模で大きな変動のある高品質なデータが不可欠である。
本稿では,DiffBoostと呼ばれる医用画像合成のための制御可能な拡散モデルを提案する。
近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。
論文 参考訳(メタデータ) (2023-10-19T16:18:02Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Bridging Synthetic and Real Images: a Transferable and Multiple
Consistency aided Fundus Image Enhancement Framework [61.74188977009786]
画像強調とドメイン適応を同時に行うために,エンドツーエンドの教師支援フレームワークを提案する。
また,教師ネットワークと学生ネットワークのバックボーンとして,マルチステージ型マルチアテンション・ガイド・エンハンスメント・ネットワーク(MAGE-Net)を提案する。
論文 参考訳(メタデータ) (2023-02-23T06:16:15Z) - A Self-attention Guided Multi-scale Gradient GAN for Diversified X-ray
Image Synthesis [0.6308539010172307]
GAN(Generative Adversarial Networks)を用いて,合成画像の生成によるデータ制限問題に対処する。
モード崩壊、非収束、不安定といったトレーニング課題は、多彩で高品質な画像の合成において、GANのパフォーマンスを低下させる。
本研究では,バイオメディカル画像の特徴の長距離依存性の関係をモデル化する,注意誘導型マルチスケール勾配GANアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-10-09T13:17:17Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - ResViT: Residual vision transformers for multi-modal medical image
synthesis [0.0]
本稿では、畳み込み演算子の局所的精度と視覚変換器の文脈的感度を組み合わせ、医用画像合成のための新しい生成逆変換手法ResViTを提案する。
以上の結果から,ResViTと競合する手法の質的観察と定量化の両面での優位性が示唆された。
論文 参考訳(メタデータ) (2021-06-30T12:57:37Z) - Hi-Net: Hybrid-fusion Network for Multi-modal MR Image Synthesis [143.55901940771568]
マルチモーダルMR画像合成のためのHybrid-fusion Network(Hi-Net)を提案する。
当社のHi-Netでは,各モーダリティの表現を学習するために,モーダリティ特化ネットワークを用いている。
マルチモーダル合成ネットワークは、潜在表現と各モーダルの階層的特徴を密結合するように設計されている。
論文 参考訳(メタデータ) (2020-02-11T08:26:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。