論文の概要: Introducing Shape Prior Module in Diffusion Model for Medical Image
Segmentation
- arxiv url: http://arxiv.org/abs/2309.05929v1
- Date: Tue, 12 Sep 2023 03:05:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 14:31:48.894944
- Title: Introducing Shape Prior Module in Diffusion Model for Medical Image
Segmentation
- Title(参考訳): 医用画像分割拡散モデルにおける形状先行モジュールの導入
- Authors: Zhiqing Zhang, Guojia Fan, Tianyong Liu, Nan Li, Yuyang Liu, Ziyu Liu,
Canwei Dong, Shoujun Zhou
- Abstract要約: 拡散確率モデル(DDPM)を利用したVerseDiff-UNetというエンドツーエンドフレームワークを提案する。
我々のアプローチは拡散モデルを標準のU字型アーキテクチャに統合する。
本手法はX線画像から得られた脊椎画像の1つのデータセットを用いて評価する。
- 参考スコア(独自算出の注目度): 7.7545714516743045
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Medical image segmentation is critical for diagnosing and treating spinal
disorders. However, the presence of high noise, ambiguity, and uncertainty
makes this task highly challenging. Factors such as unclear anatomical
boundaries, inter-class similarities, and irrational annotations contribute to
this challenge. Achieving both accurate and diverse segmentation templates is
essential to support radiologists in clinical practice. In recent years,
denoising diffusion probabilistic modeling (DDPM) has emerged as a prominent
research topic in computer vision. It has demonstrated effectiveness in various
vision tasks, including image deblurring, super-resolution, anomaly detection,
and even semantic representation generation at the pixel level. Despite the
robustness of existing diffusion models in visual generation tasks, they still
struggle with discrete masks and their various effects. To address the need for
accurate and diverse spine medical image segmentation templates, we propose an
end-to-end framework called VerseDiff-UNet, which leverages the denoising
diffusion probabilistic model (DDPM). Our approach integrates the diffusion
model into a standard U-shaped architecture. At each step, we combine the
noise-added image with the labeled mask to guide the diffusion direction
accurately towards the target region. Furthermore, to capture specific
anatomical a priori information in medical images, we incorporate a shape a
priori module. This module efficiently extracts structural semantic information
from the input spine images. We evaluate our method on a single dataset of
spine images acquired through X-ray imaging. Our results demonstrate that
VerseDiff-UNet significantly outperforms other state-of-the-art methods in
terms of accuracy while preserving the natural features and variations of
anatomy.
- Abstract(参考訳): 画像分割は脊髄疾患の診断と治療に重要である。
しかし、高騒音、曖昧さ、不確実性の存在は、この課題を非常に困難にしている。
解剖学的境界、クラス間類似性、不合理アノテーションなどの要因がこの課題に寄与する。
放射線科医を臨床で支援するためには, 正確かつ多様なセグメンテーションテンプレートの獲得が不可欠である。
近年,拡散確率モデル (DDPM) がコンピュータビジョンにおける顕著な研究トピックとして登場している。
画像の劣化、超解像、異常検出、さらにはピクセルレベルでの意味表現生成など、様々な視覚タスクにおいて有効性を示す。
視覚生成タスクにおける既存の拡散モデルの頑健さにもかかわらず、彼らは依然として離散的なマスクとその様々な効果に苦しむ。
高精度で多様な脊椎医用画像セグメンテーションテンプレートの必要性に対処するために,denoising diffusion probabilistic model (ddpm) を利用した versediff-unet と呼ばれるエンドツーエンドフレームワークを提案する。
我々のアプローチは拡散モデルを標準のU字型アーキテクチャに統合する。
各ステップにおいて、ノイズ付加画像とラベル付きマスクを組み合わせることで、拡散方向をターゲット領域へ正確に誘導する。
さらに, 医用画像から特定の解剖学的先駆情報を抽出するために, 形状を先駆モジュールとして組み込んだ。
このモジュールは、入力脊椎画像から構造的意味情報を効率よく抽出する。
本手法は,x線イメージングにより得られた脊椎画像の単一のデータセット上で評価する。
以上の結果から,VerseDiff-UNetは,解剖学の自然的特徴やバリエーションを保ちながら,他の最先端手法よりも精度が高いことがわかった。
関連論文リスト
- Multiscale Latent Diffusion Model for Enhanced Feature Extraction from Medical Images [5.395912799904941]
CTスキャナーモデルと取得プロトコルのバリエーションは、抽出した放射能特性に有意な変動をもたらす。
LTDiff++は医療画像の特徴抽出を強化するために設計されたマルチスケール潜在拡散モデルである。
論文 参考訳(メタデータ) (2024-10-05T02:13:57Z) - Advancing Medical Image Segmentation: Morphology-Driven Learning with Diffusion Transformer [4.672688418357066]
本稿では,雑音の存在下での頑健なセグメンテーションのためのトランスフォーマー拡散(DTS)モデルを提案する。
画像の形態的表現を解析する本モデルでは, 種々の医用画像モダリティにおいて, 従来のモデルよりも良好な結果が得られた。
論文 参考訳(メタデータ) (2024-08-01T07:35:54Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - EMIT-Diff: Enhancing Medical Image Segmentation via Text-Guided
Diffusion Model [4.057796755073023]
EMIT-Diffと呼ばれる医用画像合成のための制御可能な拡散モデルを開発した。
近年の拡散確率モデルを利用して、現実的で多様な合成医用画像データを生成する。
提案手法では, 合成試料が医療上の制約に適合することを確実にする。
論文 参考訳(メタデータ) (2023-10-19T16:18:02Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - Controllable Mind Visual Diffusion Model [58.83896307930354]
脳信号の可視化は、人間の視覚システムとコンピュータビジョンモデルの間の重要なインターフェースとして機能する活発な研究領域として登場した。
我々は、制御可能なマインドビジュアルモデル拡散(CMVDM)と呼ばれる新しいアプローチを提案する。
CMVDMは属性アライメントとアシスタントネットワークを用いてfMRIデータから意味情報とシルエット情報を抽出する。
そして、制御モデルを利用して抽出した情報を画像合成に活用し、セマンティクスやシルエットの観点から視覚刺激によく似た画像を生成する。
論文 参考訳(メタデータ) (2023-05-17T11:36:40Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Diff-UNet: A Diffusion Embedded Network for Volumetric Segmentation [41.608617301275935]
医療用ボリュームセグメンテーションのための新しいエンドツーエンドフレームワークDiff-UNetを提案する。
提案手法では,拡散モデルを標準U字型アーキテクチャに統合し,入力ボリュームから意味情報を効率的に抽出する。
われわれは,MRI,肝腫瘍,多臓器CTの3種類の脳腫瘍について検討した。
論文 参考訳(メタデータ) (2023-03-18T04:06:18Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Cross-Modal Contrastive Learning for Abnormality Classification and
Localization in Chest X-rays with Radiomics using a Feedback Loop [63.81818077092879]
医療画像のためのエンドツーエンドのセミスーパーバイスドクロスモーダルコントラスト学習フレームワークを提案する。
まず、胸部X線を分類し、画像特徴を生成するために画像エンコーダを適用する。
放射能の特徴は別の専用エンコーダを通過し、同じ胸部x線から生成された画像の特徴の正のサンプルとして機能する。
論文 参考訳(メタデータ) (2021-04-11T09:16:29Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。