論文の概要: Conditional diffusion model with spatial attention and latent embedding for medical image segmentation
- arxiv url: http://arxiv.org/abs/2502.06997v2
- Date: Wed, 19 Feb 2025 19:40:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-21 17:43:18.373097
- Title: Conditional diffusion model with spatial attention and latent embedding for medical image segmentation
- Title(参考訳): 医用画像分割のための空間的注意と潜伏埋め込みを伴う条件拡散モデル
- Authors: Behzad Hejrati, Soumyanil Banerjee, Carri Glide-Hurst, Ming Dong,
- Abstract要約: 医用画像分割のための空間的注意と潜伏埋め込み(cDAL)を備えた新しい条件拡散モデルを提案する。
cDALでは、拡散過程のすべての段階で、畳み込みニューラルネットワーク(CNN)ベースの判別器を使用して、生成されたラベルと実際のラベルを区別する。
現状のアルゴリズムよりも高いDiceスコアとmIoUで有意な質的,定量的な改善が見られた。
- 参考スコア(独自算出の注目度): 2.8703698954661254
- License:
- Abstract: Diffusion models have been used extensively for high quality image and video generation tasks. In this paper, we propose a novel conditional diffusion model with spatial attention and latent embedding (cDAL) for medical image segmentation. In cDAL, a convolutional neural network (CNN) based discriminator is used at every time-step of the diffusion process to distinguish between the generated labels and the real ones. A spatial attention map is computed based on the features learned by the discriminator to help cDAL generate more accurate segmentation of discriminative regions in an input image. Additionally, we incorporated a random latent embedding into each layer of our model to significantly reduce the number of training and sampling time-steps, thereby making it much faster than other diffusion models for image segmentation. We applied cDAL on 3 publicly available medical image segmentation datasets (MoNuSeg, Chest X-ray and Hippocampus) and observed significant qualitative and quantitative improvements with higher Dice scores and mIoU over the state-of-the-art algorithms. The source code is publicly available at https://github.com/Hejrati/cDAL/.
- Abstract(参考訳): 拡散モデルは高品質の画像生成やビデオ生成に広く利用されている。
本稿では,医療画像分割のための空間的注意と潜伏埋め込み(cDAL)を備えた新しい条件拡散モデルを提案する。
cDALでは、拡散過程のすべての段階で、畳み込みニューラルネットワーク(CNN)ベースの判別器を使用して、生成されたラベルと実際のラベルを区別する。
空間注意マップは、識別器が学習した特徴に基づいて算出され、cDALが入力画像中の識別領域のより正確なセグメンテーションを生成するのに役立つ。
さらに,モデルの各層にランダムな潜伏剤を埋め込み,トレーニング回数とサンプリング時間を大幅に削減し,画像セグメンテーションにおける他の拡散モデルよりもはるかに高速に行えるようにした。
我々は,3つの医用画像セグメンテーションデータセット(MoNuSeg,Chest X-ray,Hippocampus)にcDALを適用し,最先端のアルゴリズムよりも高いDiceスコアとmIoUで有意な質的,定量的な改善を観察した。
ソースコードはhttps://github.com/Hejrati/cDAL/で公開されている。
関連論文リスト
- Latent Diffusion for Medical Image Segmentation: End to end learning for fast sampling and accuracy [14.545920180010201]
遅延空間における条件拡散は、複数の相互作用対象に対して正確な画像分割を保証する。
提案モデルでは,従来の決定論的セグメンテーションモデルと比較して,ノイズに対してかなり頑健であった。
論文 参考訳(メタデータ) (2024-07-17T18:44:38Z) - DiNO-Diffusion. Scaling Medical Diffusion via Self-Supervised Pre-Training [0.0]
Dino-Diffusionは潜在拡散モデル(LDM)の自己教師型手法である
アノテーションへの依存をなくすことで、私たちのトレーニングは、公開胸部X線データセットから868万以上の未ラベル画像を活用する。
小さなデータプールからでも意味的に多様な合成データセットを生成するために使用できる。
論文 参考訳(メタデータ) (2024-07-16T10:51:21Z) - HiDiff: Hybrid Diffusion Framework for Medical Image Segmentation [16.906987804797975]
HiDiffは医療画像セグメンテーションのためのハイブリッド拡散フレームワークである。
既存の識別的セグメンテーションモデルと新しい生成的拡散モデルの強みを相乗化することができる。
小さなオブジェクトをセグメンテーションし、新しいデータセットに一般化する。
論文 参考訳(メタデータ) (2024-07-03T23:59:09Z) - EmerDiff: Emerging Pixel-level Semantic Knowledge in Diffusion Models [52.3015009878545]
我々は、追加の訓練をすることなく、きめ細かなセグメンテーションマップを生成できる画像セグメンタを開発した。
低次元特徴写像の空間的位置と画像画素間の意味的対応を同定する。
大規模な実験では、生成したセグメンテーションマップがよく説明され、画像の細部を捉えることが示されている。
論文 参考訳(メタデータ) (2024-01-22T07:34:06Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - Introducing Shape Prior Module in Diffusion Model for Medical Image
Segmentation [7.7545714516743045]
拡散確率モデル(DDPM)を利用したVerseDiff-UNetというエンドツーエンドフレームワークを提案する。
我々のアプローチは拡散モデルを標準のU字型アーキテクチャに統合する。
本手法はX線画像から得られた脊椎画像の1つのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-09-12T03:05:00Z) - Your Diffusion Model is Secretly a Zero-Shot Classifier [90.40799216880342]
大規模テキスト・画像拡散モデルからの密度推定をゼロショット分類に活用できることを示す。
分類に対する我々の生成的アプローチは、様々なベンチマークで強い結果が得られる。
我々の結果は、下流タスクにおける差別的モデルよりも生成的な利用に向けての一歩である。
論文 参考訳(メタデータ) (2023-03-28T17:59:56Z) - SDM: Spatial Diffusion Model for Large Hole Image Inpainting [106.90795513361498]
本稿では,空間拡散モデル(SDM)を提案する。
また,提案手法は非結合確率モデルと空間拡散スキームにより,高品質な大穴工法を実現する。
論文 参考訳(メタデータ) (2022-12-06T13:30:18Z) - Preservation of High Frequency Content for Deep Learning-Based Medical
Image Classification [74.84221280249876]
大量の胸部ラジオグラフィーの効率的な分析は、医師や放射線技師を助けることができる。
本稿では,視覚情報の効率的な識別と符号化のための離散ウェーブレット変換(DWT)を提案する。
論文 参考訳(メタデータ) (2022-05-08T15:29:54Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Weakly-Supervised Segmentation for Disease Localization in Chest X-Ray
Images [0.0]
医用胸部X線画像のセマンティックセグメンテーションに対する新しいアプローチを提案する。
本手法は肺と胸壁の間の異常な空気量を検出するための胸部X線検査に適用可能である。
論文 参考訳(メタデータ) (2020-07-01T20:48:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。