論文の概要: Label-efficient Multi-organ Segmentation Method with Diffusion Model
- arxiv url: http://arxiv.org/abs/2402.15216v1
- Date: Fri, 23 Feb 2024 09:25:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 14:59:38.484068
- Title: Label-efficient Multi-organ Segmentation Method with Diffusion Model
- Title(参考訳): 拡散モデルを用いたラベル効率のよい多臓器分割法
- Authors: Yongzhi Huang, Jinxin Zhu, Haseeb Hassan, Liyilei Su, Jingyu Li, and
Binding Huang
- Abstract要約: 我々は,CT画像における多臓器分割作業のための事前学習拡散モデルを用いたラベル効率の学習手法を提案する。
提案手法は, FLARE 2022データセットの最先端手法と比較して, 競合する多臓器セグメンテーション性能を実現する。
- 参考スコア(独自算出の注目度): 6.413416851085592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of multiple organs in Computed Tomography (CT) images
plays a vital role in computer-aided diagnosis systems. Various
supervised-learning approaches have been proposed recently. However, these
methods heavily depend on a large amount of high-quality labeled data, which is
expensive to obtain in practice. In this study, we present a label-efficient
learning approach using a pre-trained diffusion model for multi-organ
segmentation tasks in CT images. First, a denoising diffusion model was trained
using unlabeled CT data, generating additional two-dimensional (2D) CT images.
Then the pre-trained denoising diffusion network was transferred to the
downstream multi-organ segmentation task, effectively creating a
semi-supervised learning model that requires only a small amount of labeled
data. Furthermore, linear classification and fine-tuning decoder strategies
were employed to enhance the network's segmentation performance. Our generative
model at 256x256 resolution achieves impressive performance in terms of
Fr\'echet inception distance, spatial Fr\'echet inception distance, and
F1-score, with values of 11.32, 46.93, and 73.1\%, respectively. These results
affirm the diffusion model's ability to generate diverse and realistic 2D CT
images. Additionally, our method achieves competitive multi-organ segmentation
performance compared to state-of-the-art methods on the FLARE 2022 dataset,
particularly in limited labeled data scenarios. Remarkably, even with only 1\%
and 10\% labeled data, our method achieves Dice similarity coefficients (DSCs)
of 71.56\% and 78.51\% after fine-tuning, respectively. The method achieves a
DSC score of 51.81\% using just four labeled CT scans. These results
demonstrate the efficacy of our approach in overcoming the limitations of
supervised learning heavily reliant on large-scale labeled data.
- Abstract(参考訳): CT画像における複数の臓器の正確なセグメンテーションは,コンピュータ支援診断システムにおいて重要な役割を担っている。
近年,様々な教師付き学習手法が提案されている。
しかし、これらの手法は大量の高品質なラベル付きデータに大きく依存しており、実際に入手するには高価である。
本研究では,ct画像におけるマルチオーガンセグメンテーションタスクのための事前学習拡散モデルを用いたラベル効率のよい学習手法を提案する。
まず,ラベルのないCTデータを用いて2次元(2次元)CT画像を生成するデノナイジング拡散モデルを訓練した。
そして、事前学習した分発拡散ネットワークを下流のマルチオーガンセグメンテーションタスクに転送し、少量のラベル付きデータしか必要としない半教師付き学習モデルを効果的に作成する。
さらに、ネットワークのセグメンテーション性能を高めるために線形分類と微調整デコーダ戦略を採用した。
256x256解像度での生成モデルは、Fr'echet開始距離、空間Fr'echet開始距離、F1スコアにおいて、それぞれ11.32, 46.93, 73.1\%の値で印象的な性能を達成する。
これらの結果は拡散モデルが多様で現実的な2次元ct画像を生成する能力を証明する。
さらに,本手法は,FLARE 2022データセット,特にラベル付きデータシナリオにおいて,最先端の手法と比較して,競合するマルチ組織セグメンテーション性能を実現する。
驚くべきことに, 1\% と 10\% のラベル付きデータであっても, 微調整後の dice 類似度係数 (dscs) はそれぞれ 71.56\% と 78.51\% である。
本手法は, わずか4個のCTスキャンを用いてDSCスコアを51.81\%とする。
これらの結果は,大規模ラベル付きデータに強く依存する教師あり学習の限界を克服する手法の有効性を示す。
関連論文リスト
- PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Wound Tissue Segmentation in Diabetic Foot Ulcer Images Using Deep Learning: A Pilot Study [5.397013836968946]
我々は,創部組織分割アルゴリズムを評価するためのDFUT草案データセットを作成した。
データセットには110枚の画像と、創傷の専門家によってラベル付けされた組織、600枚の未ラベル画像が含まれている。
注釈付きデータの量が限られているため、我々のフレームワークは、教師付き学習(SL)と半教師付き学習(SSL)の両方のフェーズで構成されている。
論文 参考訳(メタデータ) (2024-06-23T05:01:51Z) - CriDiff: Criss-cross Injection Diffusion Framework via Generative Pre-train for Prostate Segmentation [60.61972883059688]
CridiffはCrisscross Injection Strategy(CIS)とGenerative Pre-train(GP)アプローチによる2段階の機能注入フレームワークである。
CISでは,複数レベルのエッジ特徴と非エッジ特徴を効果的に学習するために,並列コンディショナーを2つ提案した。
GPアプローチは、追加パラメータを追加することなく、画像特徴と拡散モデルとの矛盾を緩和する。
論文 参考訳(メタデータ) (2024-06-20T10:46:50Z) - A Closer Look at Spatial-Slice Features Learning for COVID-19 Detection [8.215897530386343]
我々は,CTスキャンに特化して設計されたSpatial-Slice Feature Learning (SSFL++) フレームワークを提案する。
本研究の目的は,全CTスキャンでOODデータをフィルタリングし,70%の冗長性を完全に低減し,解析のための重要な空間スライスを選択することである。
実験では、トレーニングデータの1%しか持たない単純なE2D(EfficientNet-2D)モデルを用いて、我々のモデルの有望な性能を実証した。
論文 参考訳(メタデータ) (2024-04-02T05:19:27Z) - Simple 2D Convolutional Neural Network-based Approach for COVID-19 Detection [8.215897530386343]
本研究では,肺CT画像解析におけるディープラーニング技術の利用について検討した。
我々は,CTスキャンに適した高度な空間スライス特徴学習(SSFL++)フレームワークを提案する。
本研究の目的は,CTスキャン全体のアウト・オブ・ディストリビューション(OOD)データをフィルタリングし,データ冗長性を70%削減して解析に不可欠な空間スライス特徴を選択することである。
論文 参考訳(メタデータ) (2024-03-17T14:34:51Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - A Unified Framework for Generalized Low-Shot Medical Image Segmentation
with Scarce Data [24.12765716392381]
距離距離距離距離学習(DML)に基づく医用画像分割の一般化のための統一的枠組みを提案する。
DMLでは,各カテゴリの多モード混合表現を学習し,画素の深層埋め込みとカテゴリ表現との間の余弦距離に基づいて密接な予測を行う。
脳MRIおよび腹部CTデータセットの実験において,提案手法は標準DNN(3D U-Net)法と古典的登録(ANT)法に対して,低ショットセグメンテーションにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-18T13:01:06Z) - Boosting Segmentation Performance across datasets using histogram
specification with application to pelvic bone segmentation [1.3750624267664155]
限られたデータで訓練されたネットワークの性能を高めるために,画像のトーン分布の変調と深層学習に基づく手法を提案する。
セグメンテーションタスクは、拡張BCE-IoU損失関数を使用して最適化されたEfficientNet-B0バックボーンを備えたU-Net構成を使用します。
論文 参考訳(メタデータ) (2021-01-26T23:48:40Z) - A Multi-Stage Attentive Transfer Learning Framework for Improving
COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。
提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。
本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-14T01:39:19Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。