論文の概要: PCA for Enhanced Cross-Dataset Generalizability in Breast Ultrasound Tumor Segmentation
- arxiv url: http://arxiv.org/abs/2505.23587v1
- Date: Thu, 29 May 2025 15:59:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.964065
- Title: PCA for Enhanced Cross-Dataset Generalizability in Breast Ultrasound Tumor Segmentation
- Title(参考訳): 乳房超音波腫瘍切除におけるPCAの有用性の検討
- Authors: Christian Schmidt, Heinrich Martin Overhoff,
- Abstract要約: 医用画像のセグメンテーションでは、モデルが見えないデータセットにデプロイされる場合、外部の妥当性が制限されることは依然として重要な障害である。
本稿では、この制限に対処するための主成分分析(PCA)の新たな適用法を提案する。
PCAプリプロセッシングはノイズを低減し、データセットの約90%の分散を保持することで必須の特徴を強調する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In medical image segmentation, limited external validity remains a critical obstacle when models are deployed across unseen datasets, an issue particularly pronounced in the ultrasound image domain. Existing solutions-such as domain adaptation and GAN-based style transfer-while promising, often fall short in the medical domain where datasets are typically small and diverse. This paper presents a novel application of principal component analysis (PCA) to address this limitation. PCA preprocessing reduces noise and emphasizes essential features by retaining approximately 90\% of the dataset variance. We evaluate our approach across six diverse breast tumor ultrasound datasets comprising 3,983 B-mode images and corresponding expert tumor segmentation masks. For each dataset, a corresponding dimensionality reduced PCA-dataset is created and U-Net-based segmentation models are trained on each of the twelve datasets. Each model trained on an original dataset was inferenced on the remaining five out-of-domain original datasets (baseline results), while each model trained on a PCA dataset was inferenced on five out-of-domain PCA datasets. Our experimental results indicate that using PCA reconstructed datasets, instead of original images, improves the model's recall and Dice scores, particularly for model-dataset pairs where baseline performance was lowest, achieving statistically significant gains in recall (0.57 $\pm$ 0.07 vs. 0.70 $\pm$ 0.05, $p = 0.0004$) and Dice scores (0.50 $\pm$ 0.06 vs. 0.58 $\pm$ 0.06, $p = 0.03$). Our method reduced the decline in recall values due to external validation by $33\%$. These findings underscore the potential of PCA reconstruction as a safeguard to mitigate declines in segmentation performance, especially in challenging cases, with implications for enhancing external validity in real-world medical applications.
- Abstract(参考訳): 医用画像のセグメンテーションでは、未確認のデータセットにモデルが配置される場合、限られた外部妥当性は依然として重要な障害であり、特に超音波画像領域で顕著な問題である。
既存のソリューション、例えばドメイン適応やGANベースのスタイル転送は有望だが、データセットが小さく多様である医療領域では、しばしば不足する。
本稿では、この制限に対処するための主成分分析(PCA)の新たな適用法を提案する。
PCA前処理はノイズを低減し、データセットの約90%の分散を保持することで必須の特徴を強調する。
3,983個のBモード画像とそれに対応する専門的腫瘍セグメント化マスクからなる乳腺腫瘍超音波データセットを用いてアプローチを評価した。
各データセットに対して、対応する次元削減PCAデータセットを作成し、12データセット毎にU-Netベースのセグメンテーションモデルをトレーニングする。
元のデータセットでトレーニングされた各モデルは、残りの5つのドメイン外のオリジナルデータセット(ベースライン結果)で推測され、PCAデータセットでトレーニングされた各モデルは、5つのドメイン外のPCAデータセットで推定された。
特にベースライン性能が低いモデル-データセットペアでは,PCA再構成データセットを使用することで,リコールにおいて統計的に有意な利得(0.57 $\pm$ 0.07 vs. 0.70 $\pm$ 0.05, $p = 0.0004$)とDiceスコア(0.50 $\pm$ 0.06 vs. 0.58 $\pm$ 0.06, $p = 0.03$)が得られる。
提案手法は,外部検証によるリコール値の低下を$33\%で低減する。
これらの結果から,PCA再建はセグメント化性能の低下,特に課題において,実際の医療応用における外的妥当性の向上に寄与する可能性が示唆された。
関連論文リスト
- DUPRE: Data Utility Prediction for Efficient Data Valuation [49.60564885180563]
Data Shapleyのような協調ゲーム理論に基づくデータ評価では、データユーティリティを評価し、複数のデータサブセットに対してMLモデルを再トレーニングする必要がある。
我々のフレームワークである textttDUPRE は、モデル再学習による評価ではなく、データユーティリティを予測することによって、サブセット評価当たりのコストを削減できる代替手法を採用しています。
具体的には、いくつかのデータサブセットのデータユーティリティを評価すると、textttDUPREは、他のすべてのデータサブセットの有用性を予測するために、emphGaussianプロセス(GP)回帰モデルに適合する。
論文 参考訳(メタデータ) (2025-02-22T08:53:39Z) - Weakly supervised deep learning model with size constraint for prostate cancer detection in multiparametric MRI and generalization to unseen domains [0.90668179713299]
本モデルでは, 完全教師付きベースラインモデルにより, オンパー性能が向上することを示す。
また、未確認データドメインでテストした場合、完全に教師付きモデルと弱い教師付きモデルの両方のパフォーマンス低下も観察する。
論文 参考訳(メタデータ) (2024-11-04T12:24:33Z) - Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Improved Robustness for Deep Learning-based Segmentation of Multi-Center Myocardial Perfusion MRI Datasets Using Data Adaptive Uncertainty-guided Space-time Analysis [0.24285581051793656]
灌流データセットの完全な自動解析により、患者のストレス/レスト研究の迅速かつ客観的な報告が可能になる。
トレーニングデータやソフトウェアやハードウェアのバリエーションが限られているにもかかわらず、マルチセンタデータセットを分析できるディープラーニング技術は、現在進行中の課題である。
提案したDAUGS分析手法は,多心応力灌流データセットのセグメンテーションのためのディープラーニング手法の堅牢性を向上させる可能性を秘めている。
論文 参考訳(メタデータ) (2024-08-09T01:21:41Z) - Quantifying uncertainty in lung cancer segmentation with foundation models applied to mixed-domain datasets [6.712251433139412]
医用画像基盤モデルは、極小調整で臓器や腫瘍を分割する能力を示している。
これらのモデルは通常、タスク固有の分散(ID)データセットで評価される。
我々は、自己教師付き学習(SSL)で訓練された複数の基礎モデルの性能を評価するために、計算的に高速なメトリクスの包括的セットを導入する。
SMITは最も高いF1スコア(LRAD: 0.60, 5Rater: 0.64)と低いエントロピー(LRAD: 0.06, 5Rater: 0.12)を生成し、高い腫瘍検出率と確実なセグメンテーションを示した。
論文 参考訳(メタデータ) (2024-03-19T19:36:48Z) - Dual-Reference Source-Free Active Domain Adaptation for Nasopharyngeal
Carcinoma Tumor Segmentation across Multiple Hospitals [9.845637899896365]
鼻咽頭癌(Nasopharyngeal carcinoma, NPC)は頭頸部の悪性腫瘍である。
本稿では,Gross tumor Volume (GTV)セグメンテーションタスクの領域適応を容易にするために,新しい Sourece-Free Active Domain Adaptation (SFADA) フレームワークを提案する。
5つの病院から1057人のNPC患者からなる大規模臨床データセットを収集し,そのアプローチを検証した。
論文 参考訳(メタデータ) (2023-09-23T15:26:27Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - Self-Supervised U-Net for Segmenting Flat and Sessile Polyps [63.62764375279861]
大腸ポリープの発達は、がんの最も初期の兆候の1つである。
ポリープの早期検出と切除は生存率を90%に大きく向上させる。
大腸内視鏡画像の処理によりポリープを検出するコンピュータ支援診断システム(CADx)が提案されている。
論文 参考訳(メタデータ) (2021-10-17T09:31:20Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。