論文の概要: SpurBreast: A Curated Dataset for Investigating Spurious Correlations in Real-world Breast MRI Classification
- arxiv url: http://arxiv.org/abs/2510.02109v1
- Date: Thu, 02 Oct 2025 15:16:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.181254
- Title: SpurBreast: A Curated Dataset for Investigating Spurious Correlations in Real-world Breast MRI Classification
- Title(参考訳): SpurBreast: 実世界の乳腺MRI分類におけるスパーラス相関の検証用データセット
- Authors: Jong Bum Won, Wesley De Neve, Joris Vankerschaver, Utku Ozbulak,
- Abstract要約: SpurBreastは乳房MRIのキュレートされたデータセットで,スプリアス相関を意図的に組み込んでモデル性能への影響を評価する。
我々は、患者、デバイス、画像プロトコルを含む100以上の特徴を分析し、磁場強度と画像配向の2つの主要な刺激信号を特定する。
制御されたデータセット分割により、DNNはこれらの非クリニカル信号を利用して、偏りのないテストデータへの一般化に失敗しながら高い検証精度を達成できることを示す。
- 参考スコア(独自算出の注目度): 0.4999814847776096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks (DNNs) have demonstrated remarkable success in medical imaging, yet their real-world deployment remains challenging due to spurious correlations, where models can learn non-clinical features instead of meaningful medical patterns. Existing medical imaging datasets are not designed to systematically study this issue, largely due to restrictive licensing and limited supplementary patient data. To address this gap, we introduce SpurBreast, a curated breast MRI dataset that intentionally incorporates spurious correlations to evaluate their impact on model performance. Analyzing over 100 features involving patient, device, and imaging protocol, we identify two dominant spurious signals: magnetic field strength (a global feature influencing the entire image) and image orientation (a local feature affecting spatial alignment). Through controlled dataset splits, we demonstrate that DNNs can exploit these non-clinical signals, achieving high validation accuracy while failing to generalize to unbiased test data. Alongside these two datasets containing spurious correlations, we also provide benchmark datasets without spurious correlations, allowing researchers to systematically investigate clinically relevant and irrelevant features, uncertainty estimation, adversarial robustness, and generalization strategies. Models and datasets are available at https://github.com/utkuozbulak/spurbreast.
- Abstract(参考訳): ディープニューラルネットワーク(Deep Neural Network, DNN)は、医療画像において顕著な成功を収めている。
既存の医療画像データセットは、この問題を体系的に研究するために設計されていない。
このギャップに対処するために、スプリアス相関を意図的に組み込んだ乳房MRIデータセットであるSpurBreastを導入し、モデル性能への影響を評価する。
患者, デバイス, 画像プロトコルを含む100以上の特徴を分析し, 磁場強度(画像全体に影響を及ぼす大域的特徴)と画像配向(空間的アライメントに影響を及ぼす局所的特徴)の2つの主要な刺激信号を特定した。
制御されたデータセット分割により、DNNはこれらの非クリニカル信号を利用して、偏りのないテストデータへの一般化に失敗しながら高い検証精度を達成できることを示す。
これら2つのデータセットの他に、スプリアス相関を伴わないベンチマークデータセットも提供し、研究者が臨床的に関連性があり無関係な特徴、不確実性推定、対向ロバスト性、一般化戦略を体系的に研究できるようにする。
モデルとデータセットはhttps://github.com/utkuozbulak/spurbreast.comで公開されている。
関連論文リスト
- Towards Trustworthy Breast Tumor Segmentation in Ultrasound using Monte Carlo Dropout and Deep Ensembles for Epistemic Uncertainty Estimation [0.01066386648660129]
乳房超音波セグメンテーションにおけるResidual U-Netの応用について検討した。
BUSIデータセットにおけるデータ重複の同定と補正を行う。
モンテカルロ・ドロップアウト、ディープアンサンブル、およびそれらの組み合わせを用いて、疫学的不確実性を定量化する。
論文 参考訳(メタデータ) (2025-08-25T08:06:07Z) - Detecting Unforeseen Data Properties with Diffusion Autoencoder Embeddings using Spine MRI data [7.757515290013924]
深層学習は、診断と予後を改善するために大規模なデータセットを利用することによって、医療画像に大きく貢献してきた。
大規模なデータセットには、主題の選択と取得による固有のエラーが伴うことが多い。
拡散オートエンコーダの埋め込みによるデータ特性とバイアスの解明と理解について検討する。
論文 参考訳(メタデータ) (2024-10-14T07:24:26Z) - Autoencoder based approach for the mitigation of spurious correlations [2.7624021966289605]
純粋な相関は、真の基盤となる関係を反映しないデータの誤関連を指す。
これらの相関により、ディープニューラルネットワーク(DNN)は、さまざまなデータセットや実世界のシナリオで堅牢でないパターンを学ぶことができる。
本稿では,GWHD(Global Wheat Head Detection)2021データセットに存在するスプリアス相関の性質を自動エンコーダで解析する手法を提案する。
論文 参考訳(メタデータ) (2024-06-27T05:28:44Z) - ssVERDICT: Self-Supervised VERDICT-MRI for Enhanced Prostate Tumour
Characterisation [2.755232740505053]
トレーニングデータなしでVERDICT推定パラメータマップを適合させる自己教師型ニューラルネットワーク。
本研究では,SsVERDICTの性能を拡散MRIモデルに適合する2つの確立されたベースライン法と比較する。
論文 参考訳(メタデータ) (2023-09-12T14:31:33Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Interpretable Additive Recurrent Neural Networks For Multivariate
Clinical Time Series [4.125698836261585]
本稿では,モデル内の変数間の関係を加法的に強制することで,モデルの複雑性と精度のバランスをとるInterpretable-RNN(I-RNN)を提案する。
I-RNNは、時間内に不均一にサンプリングされ、非同期に取得され、データが欠落している臨床時系列の特徴を特に捉えている。
本研究は,院内死亡率予測のためのPhysoronet 2012 ChallengeデータセットのI-RNNモデルと,集中治療室における血行動態の介入を予測するリアルな臨床診断支援タスクについて評価する。
論文 参考訳(メタデータ) (2021-09-15T22:30:19Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。