論文の概要: Towards 3D Semantic Image Synthesis for Medical Imaging
- arxiv url: http://arxiv.org/abs/2507.00206v1
- Date: Mon, 30 Jun 2025 19:18:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:58.651896
- Title: Towards 3D Semantic Image Synthesis for Medical Imaging
- Title(参考訳): 医用画像のための3次元セマンティック画像合成を目指して
- Authors: Wenwu Tang, Khaled Seyam, Bin Yang,
- Abstract要約: 本研究では,3次元領域で直接動作するメドLSDM(Latent Semantic Diffusion Model)を提案する。
Med-LSDMは2Dスライス生成に重点を置いている既存の方法とは異なり、3Dセマンティック画像合成に特化して設計されている。
提案手法は,Duke Breastデータセットの3D-FIDスコア0.0054を達成し,3Dセマンティックな医用画像合成において高い性能を示す。
- 参考スコア(独自算出の注目度): 3.1265626879839923
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the medical domain, acquiring large datasets is challenging due to both accessibility issues and stringent privacy regulations. Consequently, data availability and privacy protection are major obstacles to applying machine learning in medical imaging. To address this, our study proposes the Med-LSDM (Latent Semantic Diffusion Model), which operates directly in the 3D domain and leverages de-identified semantic maps to generate synthetic data as a method of privacy preservation and data augmentation. Unlike many existing methods that focus on generating 2D slices, Med-LSDM is designed specifically for 3D semantic image synthesis, making it well-suited for applications requiring full volumetric data. Med-LSDM incorporates a guiding mechanism that controls the 3D image generation process by applying a diffusion model within the latent space of a pre-trained VQ-GAN. By operating in the compressed latent space, the model significantly reduces computational complexity while still preserving critical 3D spatial details. Our approach demonstrates strong performance in 3D semantic medical image synthesis, achieving a 3D-FID score of 0.0054 on the conditional Duke Breast dataset and similar Dice scores (0.70964) to those of real images (0.71496). These results demonstrate that the synthetic data from our model have a small domain gap with real data and are useful for data augmentation.
- Abstract(参考訳): 医療分野では、アクセシビリティの問題と厳格なプライバシー規制の両方のため、大規模なデータセットの取得が難しい。
その結果、医療画像に機械学習を適用する上で、データの可用性とプライバシ保護が大きな障害となる。
そこで本研究では, 3次元領域で直接動作し, 識別不能なセマンティックマップを利用して, プライバシー保護とデータ拡張の手法として合成データを生成する, Med-LSDM (Latent Semantic Diffusion Model) を提案する。
Med-LSDMは2Dスライスを生成する多くの既存の方法とは異なり、3Dセマンティック画像合成に特化して設計されており、完全なボリュームデータを必要とするアプリケーションに適している。
Med-LSDMは、事前訓練されたVQ-GANの潜伏空間内に拡散モデルを適用することにより、3D画像生成プロセスを制御する誘導機構を組み込む。
圧縮された潜在空間で操作することにより、モデルは重要な3次元空間の詳細を保存しながら、計算の複雑さを著しく低減する。
提案手法は,Duke Breastデータセットの3D-FIDスコア0.0054,Diceスコア0.70964,実画像0.71496,3D-FIDスコア0。
これらの結果から,本モデルから得られた合成データは,実データとの領域ギャップが小さく,データ拡張に有用であることが示唆された。
関連論文リスト
- Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting [64.64738535860351]
単一ビュー画像を包括的・スケール的・外観リアルな3D表現に変換するスケーラブルなパイプラインを提案する。
本手法は,画像の膨大な保存と空間的シーン理解への需要の増大とのギャップを埋めるものである。
画像から精度の高い3Dデータを自動的に生成することにより,データ収集コストを大幅に削減し,空間知性を向上するための新たな道を開く。
論文 参考訳(メタデータ) (2025-07-24T14:53:26Z) - 3D MRI Synthesis with Slice-Based Latent Diffusion Models: Improving Tumor Segmentation Tasks in Data-Scarce Regimes [2.8498944632323755]
本稿では,ボリュームデータ生成の複雑さに対処するスライスに基づく遅延拡散アーキテクチャを提案する。
この手法は,医療用画像と関連するマスクの同時分布モデルを拡張し,データスカース体制下での同時生成を可能にする。
構造は, 大きさ, 形状, 相対位置などの腫瘍特性によって調節できるため, 腫瘍の多様性は様々である。
論文 参考訳(メタデータ) (2024-06-08T09:53:45Z) - Cross-Dimensional Medical Self-Supervised Representation Learning Based on a Pseudo-3D Transformation [68.60747298865394]
擬似3D変換(CDSSL-P3D)に基づく新しい三次元SSLフレームワークを提案する。
具体的には、2D画像を3Dデータに整合したフォーマットに変換するim2colアルゴリズムに基づく画像変換を提案する。
この変換は2次元および3次元データのシームレスな統合を可能にし、3次元医用画像解析のための相互教師あり学習を容易にする。
論文 参考訳(メタデータ) (2024-06-03T02:57:25Z) - Generative Enhancement for 3D Medical Images [74.17066529847546]
本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。
本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。
3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2024-03-19T15:57:04Z) - Three-dimensional Bone Image Synthesis with Generative Adversarial
Networks [2.499907423888049]
本研究は,高分解能医用量を生成するために,3次元生成対向ネットワーク(GAN)を効率的に訓練できることを実証する。
GANインバージョンは3次元設定のために実装され、モデル解釈可能性に関する広範な研究に使用される。
論文 参考訳(メタデータ) (2023-10-26T08:08:17Z) - 3DSAM-adapter: Holistic adaptation of SAM from 2D to 3D for promptable tumor segmentation [52.699139151447945]
医用画像の領域分割を行うために, SAMを2次元から3次元に変換する新しい適応法を提案する。
本モデルでは, 腎腫瘍, 膵腫瘍, 大腸癌の3つのタスクのうち8.25%, 29.87%, 10.11%の3つのタスクにおいて, ドメイン・オブ・ザ・アーティヴ・メディカル・イメージ・セグメンテーション・モデルより優れ, 肝腫瘍セグメンテーションでも同様の性能が得られる。
論文 参考訳(メタデータ) (2023-06-23T12:09:52Z) - Conditional Diffusion Models for Semantic 3D Brain MRI Synthesis [0.0]
Med-DDPMは3次元意味脳MRI合成のための拡散モデルである。
セマンティックコンディショニングを統合することで、データの不足とプライバシの問題に効果的に取り組む。
視覚的忠実度の高い多様なコヒーレントな画像を生成する。
論文 参考訳(メタデータ) (2023-05-29T04:14:38Z) - Medical Diffusion -- Denoising Diffusion Probabilistic Models for 3D
Medical Image Generation [0.6486409713123691]
拡散確率モデルが高品質な医用画像データを合成可能であることを示す。
本研究は,2人の医療専門家による読影研究を通じて,そのパフォーマンスを定量的に測定する。
自己教師付き事前訓練において合成画像が利用可能であることを示し,データ不足時の乳房分割モデルの性能向上を図った。
論文 参考訳(メタデータ) (2022-11-07T08:37:48Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。