論文の概要: Robust Polyp Detection and Diagnosis through Compositional Prompt-Guided Diffusion Models
- arxiv url: http://arxiv.org/abs/2502.17951v1
- Date: Tue, 25 Feb 2025 08:22:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-26 15:23:02.394356
- Title: Robust Polyp Detection and Diagnosis through Compositional Prompt-Guided Diffusion Models
- Title(参考訳): 組成プロンプト誘導拡散モデルによるロバストポリプの検出と診断
- Authors: Jia Yu, Yan Zhu, Peiyao Fu, Tianyi Chen, Junbo Huang, Quanlin Li, Pinghong Zhou, Zhihua Wang, Fei Wu, Shuo Wang, Xian Yang,
- Abstract要約: 合成ポリプ画像を生成するためのプログレッシブスペクトル拡散モデル(PSDM)を提案する。
PSDMは、セグメンテーションマスク、バウンディングボックス、大腸内視鏡検査などの様々な臨床アノテーションを統合し、それらを合成プロンプトに変換する。
トレーニングデータをPSDM生成サンプルで強化することにより,ポリプの検出,分類,セグメンテーションを大幅に改善する。
- 参考スコア(独自算出の注目度): 32.17651741681871
- License:
- Abstract: Colorectal cancer (CRC) is a significant global health concern, and early detection through screening plays a critical role in reducing mortality. While deep learning models have shown promise in improving polyp detection, classification, and segmentation, their generalization across diverse clinical environments, particularly with out-of-distribution (OOD) data, remains a challenge. Multi-center datasets like PolypGen have been developed to address these issues, but their collection is costly and time-consuming. Traditional data augmentation techniques provide limited variability, failing to capture the complexity of medical images. Diffusion models have emerged as a promising solution for generating synthetic polyp images, but the image generation process in current models mainly relies on segmentation masks as the condition, limiting their ability to capture the full clinical context. To overcome these limitations, we propose a Progressive Spectrum Diffusion Model (PSDM) that integrates diverse clinical annotations-such as segmentation masks, bounding boxes, and colonoscopy reports-by transforming them into compositional prompts. These prompts are organized into coarse and fine components, allowing the model to capture both broad spatial structures and fine details, generating clinically accurate synthetic images. By augmenting training data with PSDM-generated samples, our model significantly improves polyp detection, classification, and segmentation. For instance, on the PolypGen dataset, PSDM increases the F1 score by 2.12% and the mean average precision by 3.09%, demonstrating superior performance in OOD scenarios and enhanced generalization.
- Abstract(参考訳): 大腸癌(CRC)は重要な世界的な健康上の問題であり、早期検診は死亡率の低下に重要な役割を果たす。
ディープラーニングモデルでは、ポリプの検出、分類、セグメンテーションの改善が期待されているが、様々な臨床環境、特にアウト・オブ・ディストリビューション(OOD)データの一般化は依然として課題である。
PolypGenのようなマルチセンターデータセットはこれらの問題に対処するために開発されたが、その収集にはコストと時間を要する。
従来のデータ拡張技術は、医学画像の複雑さを捉えるのに失敗し、限られたばらつきを提供する。
拡散モデルは、合成ポリプ画像を生成するための有望な解決策として現れてきたが、現在のモデルにおける画像生成プロセスは、主にセグメンテーションマスクを条件として依存しており、完全な臨床コンテキストを捉える能力が制限されている。
これらの制約を克服するために, セグメンテーションマスク, 境界ボックス, 大腸内視鏡検査などの様々な臨床アノテーションを統合したプログレッシブスペクトラム拡散モデル(PSDM)を提案する。
これらのプロンプトは粗いコンポーネントと細かなコンポーネントで構成されており、モデルが広い空間構造と細部の両方をキャプチャし、臨床的に正確な合成画像を生成することができる。
トレーニングデータをPSDM生成サンプルで強化することにより,ポリプの検出,分類,セグメンテーションを大幅に改善する。
例えば、PolypGenデータセットでは、PSDMはF1スコアを2.12%、平均精度を3.09%増加させ、OODシナリオにおける優れたパフォーマンスと一般化の強化を示す。
関連論文リスト
- Diverse Image Generation with Diffusion Models and Cross Class Label Learning for Polyp Classification [4.747649393635696]
そこで我々は,多種多様な特徴を持つテキスト制御合成画像を生成する新しいモデルPathoPolyp-Diffを開発した。
モデルが他のクラスから特徴を学習できるように、クラス間ラベル学習を導入し、データアノテーションの面倒な作業を減らす。
論文 参考訳(メタデータ) (2025-02-08T04:26:20Z) - Polyp-Gen: Realistic and Diverse Polyp Image Generation for Endoscopic Dataset Expansion [35.74618077230043]
本稿では,最初のフルオートマチック拡散に基づく内視鏡画像生成フレームワークであるPolyp-Genを紹介する。
具体的には、ポリープ境界領域の構造的文脈を高めるために、病変誘導損失を伴う空間認識拡散訓練手法を考案する。
ポリープ領域の局所化に先立つ医学的先行を捉えるために,階層的検索に基づくサンプリング戦略を導入する。
論文 参考訳(メタデータ) (2025-01-28T03:25:37Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
大規模なデータセットのトレーニングによるスケーリングは、画像生成の品質と忠実度を高め、拡散モデルによる操作を可能にすることが示されている。
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
本研究は,異なる微調整方式と組み合わせた場合,様々なシナリオにおいて顕著な性能向上を示すものである。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - CCIS-Diff: A Generative Model with Stable Diffusion Prior for Controlled Colonoscopy Image Synthesis [7.1892156088672]
拡散アーキテクチャに基づく高品質な大腸内視鏡画像合成のための制御された生成モデルを提案する。
本手法は, 臨床記述に適合するポリープの空間特性(ポリープ位置と形状)と臨床特性の両方を正確に制御する。
論文 参考訳(メタデータ) (2024-11-19T03:30:06Z) - ECC-PolypDet: Enhanced CenterNet with Contrastive Learning for Automatic
Polyp Detection [88.4359020192429]
既存の手法では、計算コストのかかるコンテキストアグリゲーションが伴うか、ポリープの事前モデリングが欠如しているため、難解なケースでは性能が低下する。
本稿では,2段階のトレーニングとエンドツーエンド推論フレームワークである Enhanced CenterNet with Contrastive Learning (ECC-PolypDet) を提案する。
Box-assisted Contrastive Learning (BCL) は, クラス内差を最小限に抑え, 前庭ポリープと背景のクラス間差を最大化するため, 隠れポリープを捕捉する。
微調整段階におけるIoU誘導サンプル再重み付けの導入
論文 参考訳(メタデータ) (2024-01-10T07:03:41Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Self-Supervised and Semi-Supervised Polyp Segmentation using Synthetic
Data [16.356954231068077]
大腸ポリープの早期検出は、その治療および大腸癌予防において最も重要である。
コンピュータビジョン技術は、患者の大腸全体を調べるために手動で大腸手術を行う、診断段階の専門家を助ける可能性がある。
医用画像の最大の課題はデータの欠如であり、ポリプセグメンテーションアプローチに特有な課題は、手動でデータをラベル付けすることの難しさである。
本稿では, 実データと合成データを統合し, データセットのサイズを人工的に増加させ, ラベルなしサンプルが利用可能になった場合のトレーニングを支援する, ポリプセグメンテーションのエンドツーエンドモデルを提案する。
論文 参考訳(メタデータ) (2023-07-22T09:57:58Z) - Mask-conditioned latent diffusion for generating gastrointestinal polyp
images [2.027538200191349]
本研究では,与えられたセグメンテーションマスクに条件付き合成GIポリプ画像を生成する条件付きDPMフレームワークを提案する。
本システムでは,ポリプの接地真実マスクを用いて,無限個の高忠実度合成ポリプ画像を生成することができる。
以上の結果から,実データと合成データの両方からなるトレーニングデータから,DeepLabv3+から0.7751の最適マイクロイモージョンIOUが得られた。
論文 参考訳(メタデータ) (2023-04-11T14:11:17Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Co-Heterogeneous and Adaptive Segmentation from Multi-Source and
Multi-Phase CT Imaging Data: A Study on Pathological Liver and Lesion
Segmentation [48.504790189796836]
我々は,新しいセグメンテーション戦略,コヘテロジネティック・アダプティブセグメンテーション(CHASe)を提案する。
本稿では,外見に基づく半スーパービジョン,マスクに基づく対向ドメイン適応,擬似ラベルを融合した多目的フレームワークを提案する。
CHASeは4.2% sim 9.4%$の範囲で、病理的な肝臓マスクDice-Sorensen係数をさらに改善することができる。
論文 参考訳(メタデータ) (2020-05-27T06:58:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。