論文の概要: Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models
- arxiv url: http://arxiv.org/abs/2505.02753v1
- Date: Mon, 05 May 2025 16:05:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.737935
- Title: Advancing Generalizable Tumor Segmentation with Anomaly-Aware Open-Vocabulary Attention Maps and Frozen Foundation Diffusion Models
- Title(参考訳): Anomaly-Aware Open-Vocabulary Attention Mapsと凍結ファンデーション拡散モデルによる一般化可能な腫瘍分節の促進
- Authors: Yankai Jiang, Peng Zhang, Donglin Yang, Yuan Tian, Hai Lin, Xiaosong Wang,
- Abstract要約: Generalizable tumorは、さまざまな解剖学的領域にまたがるゼロショット腫瘍セグメンテーションのための単一のモデルを訓練することを目的としている。
DiffuGTSはテキストプロンプトに基づいて、異常対応のオープン語彙アテンションマップを生成する。
4つのデータセットと7つの腫瘍カテゴリの実験により,本手法の優れた性能が示された。
- 参考スコア(独自算出の注目度): 11.774375458215193
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore Generalizable Tumor Segmentation, aiming to train a single model for zero-shot tumor segmentation across diverse anatomical regions. Existing methods face limitations related to segmentation quality, scalability, and the range of applicable imaging modalities. In this paper, we uncover the potential of the internal representations within frozen medical foundation diffusion models as highly efficient zero-shot learners for tumor segmentation by introducing a novel framework named DiffuGTS. DiffuGTS creates anomaly-aware open-vocabulary attention maps based on text prompts to enable generalizable anomaly segmentation without being restricted by a predefined training category list. To further improve and refine anomaly segmentation masks, DiffuGTS leverages the diffusion model, transforming pathological regions into high-quality pseudo-healthy counterparts through latent space inpainting, and applies a novel pixel-level and feature-level residual learning approach, resulting in segmentation masks with significantly enhanced quality and generalization. Comprehensive experiments on four datasets and seven tumor categories demonstrate the superior performance of our method, surpassing current state-of-the-art models across multiple zero-shot settings. Codes are available at https://github.com/Yankai96/DiffuGTS.
- Abstract(参考訳): 本研究は,多種多様な解剖学的領域にまたがるゼロショット腫瘍セグメンテーションを,単一のモデルで訓練することを目的として,ジェネラライザブル腫瘍セグメンテーションについて検討する。
既存の手法では、セグメンテーションの品質、スケーラビリティ、適用可能な画像モダリティの範囲に関する制限に直面している。
本稿では,DiffuGTSという新しいフレームワークを導入することにより,腫瘍セグメント化のための高速ゼロショット学習者としての凍結医療基礎拡散モデルの内部表現の可能性を明らかにする。
DiffuGTSは、テキストプロンプトに基づいて、異常を意識したオープンボキャブラリアテンションマップを作成し、事前定義されたトレーニングカテゴリリストに制限されることなく、一般化可能な異常セグメンテーションを可能にする。
異常セグメンテーションマスクをさらに改善・洗練するために、DiffuGTSは拡散モデルを活用し、病気領域を潜在空間の塗布により高品質の擬似健康領域に変換し、新しいピクセルレベルおよび特徴レベルの残差学習アプローチを適用し、その結果、品質と一般化が著しく向上したセグメンテーションマスクを実現する。
4つのデータセットと7つの腫瘍カテゴリに関する総合的な実験は、複数のゼロショット設定における現在の最先端モデルを上回る、我々の手法の優れた性能を示している。
コードはhttps://github.com/Yankai96/DiffuGTSで公開されている。
関連論文リスト
- PathSegDiff: Pathology Segmentation using Diffusion model representations [63.20694440934692]
そこで我々は,Latent Diffusion Models (LDMs) を事前学習した特徴抽出器として活用する,病理組織像分割の新しい手法であるPathSegDiffを提案する。
本手法は,H&E染色組織像から多彩な意味情報を抽出するために,自己教師型エンコーダによって誘導される病理特異的LCMを用いる。
本実験は,BCSSおよびGlaSデータセットにおける従来の手法よりも大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2025-04-09T14:58:21Z) - Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image Segmentation [30.524999223901645]
完全教師なし方式で生成されるアノテーション効率のよいプロンプトを利用するSAM(Segment Anything Model)フレームワークを提案する。
我々は、モデルが高忠実度セグメンテーションを生成できるように最適なポリシーを設計するために、直接選好最適化手法を採用する。
X線, 超音波, 腹部CTなど多彩な領域にわたる肺分節, 乳房腫瘍分節, 臓器分節などのタスクにおける我々のフレームワークの最先端性能は, 低アノテーションデータシナリオにおけるその有効性を正当化するものである。
論文 参考訳(メタデータ) (2025-03-06T17:28:48Z) - Introducing Shape Prior Module in Diffusion Model for Medical Image
Segmentation [7.7545714516743045]
拡散確率モデル(DDPM)を利用したVerseDiff-UNetというエンドツーエンドフレームワークを提案する。
我々のアプローチは拡散モデルを標準のU字型アーキテクチャに統合する。
本手法はX線画像から得られた脊椎画像の1つのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-09-12T03:05:00Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - CAMIL: Context-Aware Multiple Instance Learning for Cancer Detection and Subtyping in Whole Slide Images [3.1118773046912382]
がん診断のためのコンテキスト認識型マルチインスタンス学習(CAMIL)アーキテクチャを提案する。
CAMILは隣接する制約のある注意を取り入れて、WSI(Whole Slide Images)内のタイル間の依存関係を考慮し、コンテキスト制約を事前の知識として統合する。
CAMILは非小細胞肺癌(TCGA-NSCLC)の亜型であり,リンパ節転移は検出され,AUCは97.5%,95.9%,88.1%であった。
論文 参考訳(メタデータ) (2023-05-09T10:06:37Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - M-GenSeg: Domain Adaptation For Target Modality Tumor Segmentation With
Annotation-Efficient Supervision [4.023899199756184]
M-GenSegは、クロスモダリティ腫瘍セグメンテーションのための、新しい半教師付きジェネレーショントレーニング戦略である。
4つの異なるコントラスト配列からなる脳腫瘍セグメント化データセットの性能評価を行った。
以前の技術とは異なり、M-GenSegは部分的に注釈付きソースモダリティでトレーニングする機能も導入している。
論文 参考訳(メタデータ) (2022-12-14T15:19:06Z) - Optimized Global Perturbation Attacks For Brain Tumour ROI Extraction
From Binary Classification Models [0.304585143845864]
本稿では,バイナリクラスラベルを用いた関心領域獲得のための弱教師付きアプローチを提案する。
また、事前訓練されたバイナリ分類モデルに基づいて、ジェネレータモデルをトレーニングするための新しい目的関数を提案する。
論文 参考訳(メタデータ) (2022-11-09T14:52:36Z) - Improving Classification Model Performance on Chest X-Rays through Lung
Segmentation [63.45024974079371]
本稿では, セグメンテーションによる異常胸部X線(CXR)識別性能を向上させるための深層学習手法を提案する。
提案手法は,CXR画像中の肺領域を局所化するための深層ニューラルネットワーク(XLSor)と,大規模CXRデータセットで事前学習した自己教師あり運動量コントラスト(MoCo)モデルのバックボーンを用いたCXR分類モデルである。
論文 参考訳(メタデータ) (2022-02-22T15:24:06Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Inf-Net: Automatic COVID-19 Lung Infection Segmentation from CT Images [152.34988415258988]
CT画像からの肺感染症の自動検出は、新型コロナウイルスに対処するための従来の医療戦略を強化する大きな可能性を秘めている。
CTスライスから感染領域を分割することは、高い感染特性の変化、感染と正常な組織の間の低強度のコントラストなど、いくつかの課題に直面している。
これらの課題に対処するため, 胸部CTスライスから感染部位を自動的に同定する, 新型のCOVID-19 Deep Lung infection Network (Inf-Net) が提案されている。
論文 参考訳(メタデータ) (2020-04-22T07:30:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。