論文の概要: A Dual-Mode ViT-Conditioned Diffusion Framework with an Adaptive Conditioning Bridge for Breast Cancer Segmentation
- arxiv url: http://arxiv.org/abs/2511.05989v1
- Date: Sat, 08 Nov 2025 12:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.698784
- Title: A Dual-Mode ViT-Conditioned Diffusion Framework with an Adaptive Conditioning Bridge for Breast Cancer Segmentation
- Title(参考訳): 乳がん分離のための適応型コンディショニングブリッジを用いた二重モード ViT-conditioned Diffusion Framework
- Authors: Prateek Singh, Moumita Dholey, P. K. Vinod,
- Abstract要約: 乳房超音波検査では,早期診断には精査が不可欠である。
標準的な畳み込みアーキテクチャは、十分にグローバルなコンテキストを捉えるのにしばしば不足する。
拡張UNetベースの生成デコーダと視覚変換器(ViT)エンコーダを組み合わせたフレキシブルで条件付きデノイング拡散モデルを提案する。
- 参考スコア(独自算出の注目度): 2.8110777003480654
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In breast ultrasound images, precise lesion segmentation is essential for early diagnosis; however, low contrast, speckle noise, and unclear boundaries make this difficult. Even though deep learning models have demonstrated potential, standard convolutional architectures frequently fall short in capturing enough global context, resulting in segmentations that are anatomically inconsistent. To overcome these drawbacks, we suggest a flexible, conditional Denoising Diffusion Model that combines an enhanced UNet-based generative decoder with a Vision Transformer (ViT) encoder for global feature extraction. We introduce three primary innovations: 1) an Adaptive Conditioning Bridge (ACB) for efficient, multi-scale fusion of semantic features; 2) a novel Topological Denoising Consistency (TDC) loss component that regularizes training by penalizing structural inconsistencies during denoising; and 3) a dual-head architecture that leverages the denoising objective as a powerful regularizer, enabling a lightweight auxiliary head to perform rapid and accurate inference on smaller datasets and a noise prediction head. Our framework establishes a new state-of-the-art on public breast ultrasound datasets, achieving Dice scores of 0.96 on BUSI, 0.90 on BrEaST and 0.97 on BUS-UCLM. Comprehensive ablation studies empirically validate that the model components are critical for achieving these results and for producing segmentations that are not only accurate but also anatomically plausible.
- Abstract(参考訳): 乳房超音波像では,早期診断には正確な病変分割が不可欠であるが,低コントラスト,スペックルノイズ,境界の曖昧さが困難である。
ディープラーニングモデルは潜在的な可能性を示しているが、標準的な畳み込みアーキテクチャは、十分なグローバルなコンテキストをキャプチャするに足りず、解剖学的に矛盾するセグメンテーションをもたらすことが多い。
これらの欠点を克服するために、拡張されたUNetベースの生成デコーダと大域的特徴抽出のためのビジョントランスフォーマ(ViT)エンコーダを組み合わせたフレキシブルな条件付きデノイング拡散モデルを提案する。
主なイノベーションは3つあります。
1) アダプティブ・コンディショニング・ブリッジ(ACB)
2 新規なトポロジカル・デノナイジング・コンシスタンス(TDC)損失成分で、デノナイジング中の構造的不整合を罰することによりトレーニングを規則化する。
3)より小型のデータセットとノイズ予測ヘッドに対して,軽量な補助ヘッドが迅速かつ正確な推論を行うことを可能にする。
当フレームワークは,乳房超音波データセットの新たな最先端性を確立し,BUSIのDiceスコア0.96,BrEaSTの0.90,BUS-UCLMの0.97を達成している。
包括的アブレーション研究は、モデルコンポーネントがこれらの結果を達成するために重要であり、正確なだけでなく、解剖学的に妥当なセグメンテーションを生成するために重要であることを実証的に検証している。
関連論文リスト
- DiA-gnostic VLVAE: Disentangled Alignment-Constrained Vision Language Variational AutoEncoder for Robust Radiology Reporting with Missing Modalities [3.5045368873011924]
本稿では,Dentangled Alignment を用いた頑健な放射線診断を行う DiA-gnostic VLVAE を提案する。
我々のフレームワークは、共有機能とモダリティ固有の機能を混在させることにより、モダリティの欠如に耐性を持つように設計されている。
コンパクトなLLaMA-Xデコーダは、これらの不整合表現を使用してレポートを効率的に生成する。
論文 参考訳(メタデータ) (2025-11-08T11:08:27Z) - Comparative Analysis of Data Augmentation for Clinical ECG Classification with STAR [0.0]
正弦波時間振幅サンプリング(Sinusoidal Time-Amplitude Resampling, STAR)は、連続するRピーク間で厳密に動作するビートワイド増幅である。
STARは実践的なパイプラインのために設計されており、 (i) ピークや間隔を損なうことなくトレーニングの多様性を拡大するモルフォロジー-忠実な変動、 (ii) ソースレジリエンスなトレーニング、 デバイス、サイト、コホート間の安定性をデータセット固有のチューニングなしで改善する、 (iv) ビートレベルの拡張によるレアクラスの学習の改善。
論文 参考訳(メタデータ) (2025-10-15T14:18:03Z) - HDC: Hierarchical Distillation for Multi-level Noisy Consistency in Semi-Supervised Fetal Ultrasound Segmentation [2.964206587462833]
HDCと呼ばれる新しい半教師付きセグメンテーションフレームワークが提案されている。
この枠組みは,特徴表現の整合化のための相関誘導損失と,雑音の多い学生学習を安定化するための相互情報損失の2つの目的を持つ階層的蒸留機構を導入している。
論文 参考訳(メタデータ) (2025-04-14T04:52:24Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - Guided Neural Schrödinger bridge for Brain MR image synthesis with Limited Data [3.150689113642665]
マルチモーダル脳MRIは臨床診断に不可欠な補完情報を提供する。
これを解決するために、利用可能なモダリティから欠落するモダリティを生成する様々な方法が提案されている。
本稿では,これらの制限を克服するための新しいフレームワークであるFully Guided Schr"odinger Bridge (FGSB)を提案する。
論文 参考訳(メタデータ) (2025-01-24T01:40:16Z) - Weakly supervised segmentation of intracranial aneurysms using a novel 3D focal modulation UNet [0.5106162890866905]
本稿では,新しい3次元焦点変調UNetであるFocalSegNetを提案する。
UIA検出では偽陽性率は0.21で感度は0.80であった。
論文 参考訳(メタデータ) (2023-08-06T03:28:08Z) - Reliable Joint Segmentation of Retinal Edema Lesions in OCT Images [55.83984261827332]
本稿では,信頼性の高いマルチスケールウェーブレットエンハンストランスネットワークを提案する。
本研究では,ウェーブレット型特徴抽出器ネットワークとマルチスケール変圧器モジュールを統合したセグメンテーションバックボーンを開発した。
提案手法は,他の最先端セグメンテーション手法と比較して信頼性の高いセグメンテーション精度を実現する。
論文 参考訳(メタデータ) (2022-12-01T07:32:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。