論文の概要: Diffusion Model in Latent Space for Medical Image Segmentation Task
- arxiv url: http://arxiv.org/abs/2512.01292v2
- Date: Tue, 02 Dec 2025 02:55:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-03 14:50:32.091834
- Title: Diffusion Model in Latent Space for Medical Image Segmentation Task
- Title(参考訳): 医用画像分割作業における潜時空間の拡散モデル
- Authors: Huynh Trinh Ngoc, Toan Nguyen Hai, Ba Luong Son, Long Tran Quoc,
- Abstract要約: MedSegLatDiffは、変動オートエンコーダ(VAE)と遅延拡散モデルを組み合わせた拡散ベースのフレームワークで、効率的な医用画像分割を行う。
芸術または非常に競争の激しいDiceとIoUのスコアの状態を達成し、同時に多様なセグメンテーション仮説と信頼マップを生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical image segmentation is crucial for clinical diagnosis and treatment planning. Traditional methods typically produce a single segmentation mask, failing to capture inherent uncertainty. Recent generative models enable the creation of multiple plausible masks per image, mimicking the collaborative interpretation of several clinicians. However, these approaches remain computationally heavy. We propose MedSegLatDiff, a diffusion based framework that combines a variational autoencoder (VAE) with a latent diffusion model for efficient medical image segmentation. The VAE compresses the input into a low dimensional latent space, reducing noise and accelerating training, while the diffusion process operates directly in this compact representation. We further replace the conventional MSE loss with weighted cross entropy in the VAE mask reconstruction path to better preserve tiny structures such as small nodules. MedSegLatDiff is evaluated on ISIC-2018 (skin lesions), CVC-Clinic (polyps), and LIDC-IDRI (lung nodules). It achieves state of the art or highly competitive Dice and IoU scores while simultaneously generating diverse segmentation hypotheses and confidence maps. This provides enhanced interpretability and reliability compared to deterministic baselines, making the model particularly suitable for clinical deployment.
- Abstract(参考訳): 医用画像分割は臨床診断と治療計画に不可欠である。
伝統的な手法は一般的に単一のセグメンテーションマスクを生成し、固有の不確かさを捉えない。
最近の生成モデルは、複数の臨床医の協力的な解釈を模倣して、画像ごとに複数の可塑性マスクを作成することができる。
しかし、これらの手法は依然として計算量が多い。
MedSegLatDiffは、変動型オートエンコーダ(VAE)と潜時拡散モデルを組み合わせた拡散ベースのフレームワークで、効率的な医用画像分割を実現する。
VAEは入力を低次元の潜伏空間に圧縮し、ノイズを低減し訓練を加速し、拡散過程はこのコンパクトな表現で直接動作する。
VAEマスク再建経路における従来のMSE損失を重み付きクロスエントロピーに置き換えて,小結節などの微細構造をよりよく保存する。
MedSegLatDiffはISIC-2018(皮膚病変)、CVC-Clinic(ポリープ)、LIDC-IDRI(肺結節)で評価される。
最先端または高い競争力を持つDiceとIoUのスコアを達成しつつ、多様なセグメンテーション仮説と信頼マップを同時に生成する。
これにより、決定論的ベースラインに比べて解釈可能性と信頼性が向上し、特に臨床展開に適したモデルとなる。
関連論文リスト
- MedCondDiff: Lightweight, Robust, Semantically Guided Diffusion for Medical Image Segmentation [5.838464931565891]
医用画像セグメンテーションのための拡散型フレームワークであるMedCondDiffを紹介する。
モデルでは、ピラミッドビジョントランスフォーマー(PVT)バックボーンから抽出されたセマンティックプリエントをデノナイズ処理する。
この設計は、推論時間とVRAM使用量の両方を削減しながら、堅牢性を改善する。
論文 参考訳(メタデータ) (2025-11-29T06:43:15Z) - UniSegDiff: Boosting Unified Lesion Segmentation via a Staged Diffusion Model [53.34835793648352]
病変分割のための新しい拡散モデルフレームワークUniSegDiffを提案する。
UniSegDiffは、複数のモダリティと臓器にまたがる統一された方法で病変のセグメンテーションに対処する。
総合的な実験結果から、UniSegDiffは従来のSOTA(State-of-the-art)アプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-07-24T12:33:10Z) - LEAF: Latent Diffusion with Efficient Encoder Distillation for Aligned Features in Medical Image Segmentation [2.529281336118734]
本稿では,潜伏拡散モデルに基づく医療画像分割モデルLEAFを提案する。
微調整の過程では,元のノイズ予測パターンをセグメントマップの直接予測に置き換える。
また, コンボリューション層の隠れ状態と, 変圧器を用いた視覚エンコーダの特徴とを一致させるために, 特徴蒸留法を用いる。
論文 参考訳(メタデータ) (2025-07-24T09:08:04Z) - MAMBO-NET: Multi-Causal Aware Modeling Backdoor-Intervention Optimization for Medical Image Segmentation Network [51.68708264694361]
融合因子は、複雑な解剖学的変異や画像のモダリティ制限などの医療画像に影響を与える可能性がある。
医用画像セグメンテーションのためのバックドア・インターベンション最適化ネットワークを提案する。
本手法は, 混乱要因の影響を著しく低減し, セグメンテーション精度を向上させる。
論文 参考訳(メタデータ) (2025-05-28T01:40:10Z) - FlowSDF: Flow Matching for Medical Image Segmentation Using Distance Transforms [60.195642571004804]
本稿では,セグメンテーションマスクの暗黙分布を表現するために,画像誘導型条件付きフローマッチングフレームワークであるFlowSDFを紹介する。
本フレームワークは,セグメンテーションマスクの正確なサンプリングと関連する統計指標の計算を可能にする。
論文 参考訳(メタデータ) (2024-05-28T11:47:12Z) - DiffSeg: A Segmentation Model for Skin Lesions Based on Diffusion Difference [2.9082809324784082]
拡散差に基づく皮膚病変のセグメンテーションモデルDiffSegを紹介する。
マルチアウトプット能力は医師のアノテーションの振る舞いを模倣し、セグメンテーション結果の一貫性とあいまいさの可視化を容易にする。
我々は,ISIC 2018 ChallengeデータセットにおけるDiffSegの有効性を示す。
論文 参考訳(メタデータ) (2024-04-25T09:57:52Z) - Introducing Shape Prior Module in Diffusion Model for Medical Image
Segmentation [7.7545714516743045]
拡散確率モデル(DDPM)を利用したVerseDiff-UNetというエンドツーエンドフレームワークを提案する。
我々のアプローチは拡散モデルを標準のU字型アーキテクチャに統合する。
本手法はX線画像から得られた脊椎画像の1つのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-09-12T03:05:00Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - MedSegDiff-V2: Diffusion based Medical Image Segmentation with
Transformer [53.575573940055335]
我々は、MedSegDiff-V2と呼ばれるトランスフォーマーベースの拡散フレームワークを提案する。
画像の異なる20種類の画像分割作業において,その有効性を検証する。
論文 参考訳(メタデータ) (2023-01-19T03:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。