論文の概要: Label-efficient Multi-organ Segmentation Method with Diffusion Model
- arxiv url: http://arxiv.org/abs/2402.15216v1
- Date: Fri, 23 Feb 2024 09:25:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 14:59:38.484068
- Title: Label-efficient Multi-organ Segmentation Method with Diffusion Model
- Title(参考訳): 拡散モデルを用いたラベル効率のよい多臓器分割法
- Authors: Yongzhi Huang, Jinxin Zhu, Haseeb Hassan, Liyilei Su, Jingyu Li, and
Binding Huang
- Abstract要約: 我々は,CT画像における多臓器分割作業のための事前学習拡散モデルを用いたラベル効率の学習手法を提案する。
提案手法は, FLARE 2022データセットの最先端手法と比較して, 競合する多臓器セグメンテーション性能を実現する。
- 参考スコア(独自算出の注目度): 6.413416851085592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of multiple organs in Computed Tomography (CT) images
plays a vital role in computer-aided diagnosis systems. Various
supervised-learning approaches have been proposed recently. However, these
methods heavily depend on a large amount of high-quality labeled data, which is
expensive to obtain in practice. In this study, we present a label-efficient
learning approach using a pre-trained diffusion model for multi-organ
segmentation tasks in CT images. First, a denoising diffusion model was trained
using unlabeled CT data, generating additional two-dimensional (2D) CT images.
Then the pre-trained denoising diffusion network was transferred to the
downstream multi-organ segmentation task, effectively creating a
semi-supervised learning model that requires only a small amount of labeled
data. Furthermore, linear classification and fine-tuning decoder strategies
were employed to enhance the network's segmentation performance. Our generative
model at 256x256 resolution achieves impressive performance in terms of
Fr\'echet inception distance, spatial Fr\'echet inception distance, and
F1-score, with values of 11.32, 46.93, and 73.1\%, respectively. These results
affirm the diffusion model's ability to generate diverse and realistic 2D CT
images. Additionally, our method achieves competitive multi-organ segmentation
performance compared to state-of-the-art methods on the FLARE 2022 dataset,
particularly in limited labeled data scenarios. Remarkably, even with only 1\%
and 10\% labeled data, our method achieves Dice similarity coefficients (DSCs)
of 71.56\% and 78.51\% after fine-tuning, respectively. The method achieves a
DSC score of 51.81\% using just four labeled CT scans. These results
demonstrate the efficacy of our approach in overcoming the limitations of
supervised learning heavily reliant on large-scale labeled data.
- Abstract(参考訳): CT画像における複数の臓器の正確なセグメンテーションは,コンピュータ支援診断システムにおいて重要な役割を担っている。
近年,様々な教師付き学習手法が提案されている。
しかし、これらの手法は大量の高品質なラベル付きデータに大きく依存しており、実際に入手するには高価である。
本研究では,ct画像におけるマルチオーガンセグメンテーションタスクのための事前学習拡散モデルを用いたラベル効率のよい学習手法を提案する。
まず,ラベルのないCTデータを用いて2次元(2次元)CT画像を生成するデノナイジング拡散モデルを訓練した。
そして、事前学習した分発拡散ネットワークを下流のマルチオーガンセグメンテーションタスクに転送し、少量のラベル付きデータしか必要としない半教師付き学習モデルを効果的に作成する。
さらに、ネットワークのセグメンテーション性能を高めるために線形分類と微調整デコーダ戦略を採用した。
256x256解像度での生成モデルは、Fr'echet開始距離、空間Fr'echet開始距離、F1スコアにおいて、それぞれ11.32, 46.93, 73.1\%の値で印象的な性能を達成する。
これらの結果は拡散モデルが多様で現実的な2次元ct画像を生成する能力を証明する。
さらに,本手法は,FLARE 2022データセット,特にラベル付きデータシナリオにおいて,最先端の手法と比較して,競合するマルチ組織セグメンテーション性能を実現する。
驚くべきことに, 1\% と 10\% のラベル付きデータであっても, 微調整後の dice 類似度係数 (dscs) はそれぞれ 71.56\% と 78.51\% である。
本手法は, わずか4個のCTスキャンを用いてDSCスコアを51.81\%とする。
これらの結果は,大規模ラベル付きデータに強く依存する教師あり学習の限界を克服する手法の有効性を示す。
関連論文リスト
- Augmentation is AUtO-Net: Augmentation-Driven Contrastive Multiview
Learning for Medical Image Segmentation [3.1002416427168304]
この論文は網膜血管セグメンテーションの課題に焦点を当てている。
深層学習に基づく医用画像セグメンテーションアプローチの広範な文献レビューを提供する。
効率的でシンプルな多視点学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-02T06:31:08Z) - Prompt Tuning for Parameter-efficient Medical Image Segmentation [79.09285179181225]
2つの医用画像データセットのセマンティックセグメンテーションにパラメータ効率が良いが効果的な適応を実現するために,いくつかのコントリビューションを提案し,検討する。
我々はこのアーキテクチャを、オンライン生成プロトタイプへの割り当てに基づく専用密集型セルフスーパービジョンスキームで事前訓練する。
得られたニューラルネットワークモデルにより、完全に微調整されたモデルとパラメータに適応したモデルとのギャップを緩和できることを実証する。
論文 参考訳(メタデータ) (2022-11-16T21:55:05Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - A Unified Framework for Generalized Low-Shot Medical Image Segmentation
with Scarce Data [24.12765716392381]
距離距離距離距離学習(DML)に基づく医用画像分割の一般化のための統一的枠組みを提案する。
DMLでは,各カテゴリの多モード混合表現を学習し,画素の深層埋め込みとカテゴリ表現との間の余弦距離に基づいて密接な予測を行う。
脳MRIおよび腹部CTデータセットの実験において,提案手法は標準DNN(3D U-Net)法と古典的登録(ANT)法に対して,低ショットセグメンテーションにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-18T13:01:06Z) - Boosting Segmentation Performance across datasets using histogram
specification with application to pelvic bone segmentation [1.3750624267664155]
限られたデータで訓練されたネットワークの性能を高めるために,画像のトーン分布の変調と深層学習に基づく手法を提案する。
セグメンテーションタスクは、拡張BCE-IoU損失関数を使用して最適化されたEfficientNet-B0バックボーンを備えたU-Net構成を使用します。
論文 参考訳(メタデータ) (2021-01-26T23:48:40Z) - A Multi-Stage Attentive Transfer Learning Framework for Improving
COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。
提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。
本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2021-01-14T01:39:19Z) - Dense Contrastive Learning for Self-Supervised Visual Pre-Training [102.15325936477362]
入力画像の2つのビュー間の画素レベルでの差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分)を最適化することにより自己教師学習を実現する。
ベースライン法であるMoCo-v2と比較すると,計算オーバーヘッドは1%遅かった。
論文 参考訳(メタデータ) (2020-11-18T08:42:32Z) - Cross-Domain Segmentation with Adversarial Loss and Covariate Shift for
Biomedical Imaging [2.1204495827342438]
本論文は,異なるモダリティから異なるパターンと共有パターンをカプセル化することにより,ドメイン間データから堅牢な表現を学習できる新しいモデルの実現を目的とする。
正常な臨床試験で得られたCTおよびMRI肝データに対する試験は、提案したモデルが他のすべてのベースラインを大きなマージンで上回っていることを示している。
論文 参考訳(メタデータ) (2020-06-08T07:35:55Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z) - 3D medical image segmentation with labeled and unlabeled data using
autoencoders at the example of liver segmentation in CT images [58.720142291102135]
本研究では、畳み込みニューラルネットワークによるセグメンテーションを改善するために、オートエンコーダ抽出機能の可能性を検討する。
コンボリューション・オートエンコーダを用いてラベルのないデータから特徴を抽出し,CT画像における3次元肝セグメンテーションの目標タスクを実行するために,マルチスケールの完全畳み込みCNNを用いた。
論文 参考訳(メタデータ) (2020-03-17T20:20:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。