論文の概要: Diffusion-Based Data Augmentation for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2508.17844v1
- Date: Mon, 25 Aug 2025 09:49:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.713919
- Title: Diffusion-Based Data Augmentation for Medical Image Segmentation
- Title(参考訳): 拡散に基づく医用画像分割のためのデータ拡張
- Authors: Maham Nazir, Muhammad Aqeel, Francesco Setti,
- Abstract要約: DiffAugは、テキスト誘導拡散ベースの生成と自動セグメンテーションバリデーションを組み合わせた、新しいフレームワークである。
我々のフレームワークは、ベースラインよりも8-10%Diceの改善で最先端のパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 2.841725244360927
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Medical image segmentation models struggle with rare abnormalities due to scarce annotated pathological data. We propose DiffAug a novel framework that combines textguided diffusion-based generation with automatic segmentation validation to address this challenge. Our proposed approach uses latent diffusion models conditioned on medical text descriptions and spatial masks to synthesize abnormalities via inpainting on normal images. Generated samples undergo dynamic quality validation through a latentspace segmentation network that ensures accurate localization while enabling single-step inference. The text prompts, derived from medical literature, guide the generation of diverse abnormality types without requiring manual annotation. Our validation mechanism filters synthetic samples based on spatial accuracy, maintaining quality while operating efficiently through direct latent estimation. Evaluated on three medical imaging benchmarks (CVC-ClinicDB, Kvasir-SEG, REFUGE2), our framework achieves state-of-the-art performance with 8-10% Dice improvements over baselines and reduces false negative rates by up to 28% for challenging cases like small polyps and flat lesions critical for early detection in screening applications.
- Abstract(参考訳): 医用画像分割モデルでは, 病理所見が乏しいため, まれな異常に悩まされる。
本稿では,テキスト誘導拡散に基づく生成と自動分割検証を組み合わせた新しいフレームワークDiffAugを提案する。
提案手法は,医療用テキスト記述と空間マスクに条件付き潜時拡散モデルを用いて,正常な画像に塗布することで異常を合成する。
生成したサンプルは、単一ステップの推論を可能にしながら正確なローカライゼーションを保証するラテンスペースセグメンテーションネットワークを通じて動的品質検証を行う。
このテキストは、医学文献から派生したもので、マニュアルアノテーションを必要とせずに、多様な異常タイプの生成を誘導する。
評価機構は空間的精度に基づいて合成試料をフィルタリングし, 直接潜時推定により効率よく動作しながら品質を維持する。
CVC-ClinicDB, Kvasir-SEG, REFUGE2) で評価したところ,本フレームワークは,ベースラインよりも8~10%Diceの改善を達成し,スクリーニングアプリケーションにおいて早期発見に不可欠な小ポリープや平坦病変などの課題に対して,偽陰性率を最大28%低減する。
関連論文リスト
- Zero-shot Segmentation of Skin Conditions: Erythema with Edit-Friendly Inversion [0.27624021966289597]
本研究は, 拡散モデルにおける編集フレンドリーな逆転を用いたエロテマ(皮膚の赤み)の検出のためのゼロショット画像分割フレームワークを提案する。
この方法は、生成的編集により、エリスマのない同一患者の参照画像を合成し、これらの参照を元の画像と正確に整合させる。
論文 参考訳(メタデータ) (2025-08-02T12:00:35Z) - SkinDualGen: Prompt-Driven Diffusion for Simultaneous Image-Mask Generation in Skin Lesions [0.0]
本稿では, トレーニング済み安定拡散2.0モデルを用いて, 高品質な合成皮膚病変画像を生成する手法を提案する。
実データと合成データを組み合わせたハイブリッドデータセットは、分類とセグメンテーションモデルの性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-07-26T15:00:37Z) - MedDiff-FT: Data-Efficient Diffusion Model Fine-tuning with Structural Guidance for Controllable Medical Image Synthesis [19.36433173105439]
MedDiff-FTは、拡散基盤モデルを微調整して、構造的依存性と領域特異性を持つ医用画像を生成する、制御可能な医用画像生成法である。
このフレームワークは、生成品質、多様性、計算効率を効果的にバランスさせ、医療データ拡張のための実用的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-07-01T02:22:32Z) - Trustworthy image-to-image translation: evaluating uncertainty calibration in unpaired training scenarios [0.0]
マンモグラフィスクリーニングは乳がんの検出に有効な方法であり、早期診断を容易にする。
ディープニューラルネットワークはいくつかの研究で有効であることが示されているが、その傾向は一般化と誤診のリスクをかなり残している。
汎用性を向上させるために、未ペア型ニューラルスタイル転送モデルに基づくデータ拡張スキームが提案されている。
3つのオープンアクセスマンモグラフィーデータセットと1つの非医療画像データセットから解析した画像パッチを用いて、それらの性能を評価する。
論文 参考訳(メタデータ) (2025-01-29T11:09:50Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - Towards Unbiased COVID-19 Lesion Localisation and Segmentation via
Weakly Supervised Learning [66.36706284671291]
本研究では,画像レベルラベルのみに監視されたデータ駆動型フレームワークを提案する。
このフレームワークは、生成する対向ネットワークと病変特異的デコーダの助けを借りて、原画像から潜在的な病変を明示的に分離することができる。
論文 参考訳(メタデータ) (2021-03-01T06:05:49Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。