論文の概要: Towards 3D Semantic Image Synthesis for Medical Imaging
- arxiv url: http://arxiv.org/abs/2507.00206v1
- Date: Mon, 30 Jun 2025 19:18:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:58.651896
- Title: Towards 3D Semantic Image Synthesis for Medical Imaging
- Title(参考訳): 医用画像のための3次元セマンティック画像合成を目指して
- Authors: Wenwu Tang, Khaled Seyam, Bin Yang,
- Abstract要約: 本研究では,3次元領域で直接動作するメドLSDM(Latent Semantic Diffusion Model)を提案する。
Med-LSDMは2Dスライス生成に重点を置いている既存の方法とは異なり、3Dセマンティック画像合成に特化して設計されている。
提案手法は,Duke Breastデータセットの3D-FIDスコア0.0054を達成し,3Dセマンティックな医用画像合成において高い性能を示す。
- 参考スコア(独自算出の注目度): 3.1265626879839923
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the medical domain, acquiring large datasets is challenging due to both accessibility issues and stringent privacy regulations. Consequently, data availability and privacy protection are major obstacles to applying machine learning in medical imaging. To address this, our study proposes the Med-LSDM (Latent Semantic Diffusion Model), which operates directly in the 3D domain and leverages de-identified semantic maps to generate synthetic data as a method of privacy preservation and data augmentation. Unlike many existing methods that focus on generating 2D slices, Med-LSDM is designed specifically for 3D semantic image synthesis, making it well-suited for applications requiring full volumetric data. Med-LSDM incorporates a guiding mechanism that controls the 3D image generation process by applying a diffusion model within the latent space of a pre-trained VQ-GAN. By operating in the compressed latent space, the model significantly reduces computational complexity while still preserving critical 3D spatial details. Our approach demonstrates strong performance in 3D semantic medical image synthesis, achieving a 3D-FID score of 0.0054 on the conditional Duke Breast dataset and similar Dice scores (0.70964) to those of real images (0.71496). These results demonstrate that the synthetic data from our model have a small domain gap with real data and are useful for data augmentation.
- Abstract(参考訳): 医療分野では、アクセシビリティの問題と厳格なプライバシー規制の両方のため、大規模なデータセットの取得が難しい。
その結果、医療画像に機械学習を適用する上で、データの可用性とプライバシ保護が大きな障害となる。
そこで本研究では, 3次元領域で直接動作し, 識別不能なセマンティックマップを利用して, プライバシー保護とデータ拡張の手法として合成データを生成する, Med-LSDM (Latent Semantic Diffusion Model) を提案する。
Med-LSDMは2Dスライスを生成する多くの既存の方法とは異なり、3Dセマンティック画像合成に特化して設計されており、完全なボリュームデータを必要とするアプリケーションに適している。
Med-LSDMは、事前訓練されたVQ-GANの潜伏空間内に拡散モデルを適用することにより、3D画像生成プロセスを制御する誘導機構を組み込む。
圧縮された潜在空間で操作することにより、モデルは重要な3次元空間の詳細を保存しながら、計算の複雑さを著しく低減する。
提案手法は,Duke Breastデータセットの3D-FIDスコア0.0054,Diceスコア0.70964,実画像0.71496,3D-FIDスコア0。
これらの結果から,本モデルから得られた合成データは,実データとの領域ギャップが小さく,データ拡張に有用であることが示唆された。
関連論文リスト
- Cross-Dimensional Medical Self-Supervised Representation Learning Based on a Pseudo-3D Transformation [68.60747298865394]
擬似3D変換(CDSSL-P3D)に基づく新しい三次元SSLフレームワークを提案する。
具体的には、2D画像を3Dデータに整合したフォーマットに変換するim2colアルゴリズムに基づく画像変換を提案する。
この変換は2次元および3次元データのシームレスな統合を可能にし、3次元医用画像解析のための相互教師あり学習を容易にする。
論文 参考訳(メタデータ) (2024-06-03T02:57:25Z) - Generative Enhancement for 3D Medical Images [74.17066529847546]
本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。
本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。
3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2024-03-19T15:57:04Z) - Conditional Diffusion Models for Semantic 3D Brain MRI Synthesis [0.0]
Med-DDPMは3次元意味脳MRI合成のための拡散モデルである。
セマンティックコンディショニングを統合することで、データの不足とプライバシの問題に効果的に取り組む。
視覚的忠実度の高い多様なコヒーレントな画像を生成する。
論文 参考訳(メタデータ) (2023-05-29T04:14:38Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。