論文の概要: Multivariate Analysis on Performance Gaps of Artificial Intelligence
Models in Screening Mammography
- arxiv url: http://arxiv.org/abs/2305.04422v3
- Date: Thu, 19 Oct 2023 18:03:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 11:52:04.029842
- Title: Multivariate Analysis on Performance Gaps of Artificial Intelligence
Models in Screening Mammography
- Title(参考訳): マンモグラフィにおける人工知能モデルの性能ギャップの多変量解析
- Authors: Linglin Zhang, Beatrice Brown-Mulry, Vineela Nalla, InChan Hwang, Judy
Wawira Gichoya, Aimilia Gastounioti, Imon Banerjee, Laleh Seyyed-Kalantari,
MinJae Woo, Hari Trivedi
- Abstract要約: 異常分類のための深層学習モデルは,マンモグラフィーのスクリーニングにおいて良好に機能する。
モデル不全のリスクの増加に伴う人口統計学的、画像的、臨床的特徴はいまだに不明である。
年齢,人種,病理所見,組織密度,画像特徴によって定義されるサブグループによるモデル性能の評価を行った。
- 参考スコア(独自算出の注目度): 4.123006816939975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although deep learning models for abnormality classification can perform well
in screening mammography, the demographic, imaging, and clinical
characteristics associated with increased risk of model failure remain unclear.
This retrospective study uses the Emory BrEast Imaging Dataset(EMBED)
containing mammograms from 115931 patients imaged at Emory Healthcare between
2013-2020, with BI-RADS assessment, region of interest coordinates for
abnormalities, imaging features, pathologic outcomes, and patient demographics.
Multiple deep learning models were trained to distinguish between abnormal
tissue patches and randomly selected normal tissue patches from screening
mammograms. We assessed model performance by subgroups defined by age, race,
pathologic outcome, tissue density, and imaging characteristics and
investigated their associations with false negatives (FN) and false positives
(FP). We also performed multivariate logistic regression to control for
confounding between subgroups. The top-performing model, ResNet152V2, achieved
accuracy of 92.6%(95%CI=92.0-93.2%), and AUC 0.975(95%CI=0.972-0.978). Before
controlling for confounding, nearly all subgroups showed statistically
significant differences in model performance. However, after controlling for
confounding, we found lower FN risk associates with Other
race(RR=0.828;p=.050), biopsy-proven benign lesions(RR=0.927;p=.011), and
mass(RR=0.921;p=.010) or asymmetry(RR=0.854;p=.040); higher FN risk associates
with architectural distortion (RR=1.037;p<.001). Higher FP risk associates to
BI-RADS density C(RR=1.891;p<.001) and D(RR=2.486;p<.001). Our results
demonstrate subgroup analysis is important in mammogram classifier performance
evaluation, and controlling for confounding between subgroups elucidates the
true associations between variables and model failure. These results can help
guide developing future breast cancer detection models.
- Abstract(参考訳): 異常分類のための深層学習モデルはマンモグラフィーのスクリーニングにおいて良好に機能するが, モデル故障のリスクの増加に伴う人口動態, 画像, 臨床特性はいまだ不明である。
本研究は,2013-2020年にエモリー・ヘルスケアで画像化された115931例のマンモグラムを含むエモリーBrEast Imaging Dataset(EMBED)を用いて,BI-RADS評価,異常,画像の特徴,病理学的結果,患者の人口動態について検討した。
複数のディープラーニングモデルは、異常組織パッチとランダムに選択された正常組織パッチとスクリーニングマンモグラムを区別するために訓練された。
年齢, 人種, 病理結果, 組織密度, 画像特性で定義されたサブグループによるモデル性能を評価し, 偽陰性 (fn) と偽陽性 (fp) との関連について検討した。
また,部分群間の結合のために多変量ロジスティック回帰を行った。
最高性能のResNet152V2は92.6%(95%CI=92.0-93.2%)、AUC 0.975(95%CI=0.972-0.978)の精度を達成した。
コンバウンディングの制御前, ほぼすべてのサブグループは, モデル性能に統計的に有意な差を示した。
しかし,fnリスクの低下は他の人種(rr=0.828;p=.050),生検による良性病変(rr=0.927;p=.011),質量(rr=0.921;p=.010),非対称性(rr=0.854;p=.040)と相関し,高いfnリスクは建築的歪み(rr=1.037;p<.001)と関連していることがわかった。
より高いFPリスクはBI-RADS密度C(RR=1.891;p<.001)とD(RR=2.486;p<.001)に関連付けられる。
本研究は, マンモグラム分類器の性能評価において, サブグループ解析が重要であることを示すとともに, モデル故障と変数の真の関連を解明する。
これらの結果は、将来の乳癌検出モデルの開発に役立つ。
関連論文リスト
- CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - A Demographic-Conditioned Variational Autoencoder for fMRI Distribution Sampling and Removal of Confounds [49.34500499203579]
変動型オートエンコーダ(VAE)ベースのモデルであるDemoVAEを作成し、人口統計学から fMRI の特徴を推定する。
ユーザが供給する人口動態に基づいて,高品質な合成fMRIデータを生成する。
論文 参考訳(メタデータ) (2024-05-13T17:49:20Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Improving Fairness of Automated Chest X-ray Diagnosis by Contrastive
Learning [19.948079693716075]
提案するAIモデルは、教師付きコントラスト学習を利用して、CXR診断におけるバイアスを最小限にする。
77,887個のCXR画像を用いたMIDRCデータセットと,112,120個のCXR画像を用いたNIH Chest X-rayデータセットの2つのデータセットについて評価を行った。
論文 参考訳(メタデータ) (2024-01-25T20:03:57Z) - Performance of externally validated machine learning models based on
histopathology images for the diagnosis, classification, prognosis, or
treatment outcome prediction in female breast cancer: A systematic review [0.5792122879054292]
女性乳癌の診断、分類、予後、治療結果予測のための外部検証された機械学習モデル。
診断用MLモデル3例,分類用4例,予後用2例,予後用1例について検討した。
ほとんどの研究では畳み込みニューラルネットワークとロジスティック回帰アルゴリズムが使用されている。
論文 参考訳(メタデータ) (2023-12-09T18:27:56Z) - A Two-Stage Generative Model with CycleGAN and Joint Diffusion for
MRI-based Brain Tumor Detection [41.454028276986946]
本稿では,脳腫瘍の検出とセグメンテーションを改善するための2段階生成モデル(TSGM)を提案する。
CycleGANは、未ペアデータに基づいてトレーニングされ、データとして正常な画像から異常な画像を生成する。
VE-JPは、合成対の異常画像をガイドとして使用して、健康な画像の再構成を行う。
論文 参考訳(メタデータ) (2023-11-06T12:58:26Z) - TotalSegmentator: robust segmentation of 104 anatomical structures in CT
images [48.50994220135258]
身体CT画像の深層学習セグメント化モデルを提案する。
このモデルは、臓器の容積、疾患の特徴、外科的または放射線療法計画などのユースケースに関連する104の解剖学的構造を区分することができる。
論文 参考訳(メタデータ) (2022-08-11T15:16:40Z) - Automated SSIM Regression for Detection and Quantification of Motion
Artefacts in Brain MR Images [54.739076152240024]
磁気共鳴脳画像における運動アーチファクトは重要な問題である。
MR画像の画質評価は,臨床診断に先立って基本的である。
構造類似度指数(SSIM)回帰に基づく自動画像品質評価法が提案されている。
論文 参考訳(メタデータ) (2022-06-14T10:16:54Z) - StRegA: Unsupervised Anomaly Detection in Brain MRIs using a Compact
Context-encoding Variational Autoencoder [48.2010192865749]
教師なし異常検出(UAD)は、健康な被験者の異常なデータセットからデータ分布を学習し、分布サンプルの抽出に応用することができる。
本研究では,コンテクストエンコーディング(context-encoding)VAE(ceVAE)モデルのコンパクトバージョンと,前処理と後処理のステップを組み合わせて,UADパイプライン(StRegA)を作成することを提案する。
提案したパイプラインは、BraTSデータセットのT2w画像と0.859$pm$0.112の腫瘍を検出しながら、Diceスコアが0.642$pm$0.101に達した。
論文 参考訳(メタデータ) (2022-01-31T14:27:35Z) - SCREENet: A Multi-view Deep Convolutional Neural Network for
Classification of High-resolution Synthetic Mammographic Screening Scans [3.8137985834223502]
本研究では,高分解能合成マンモグラム解析のための多視点深層学習手法の開発と評価を行う。
画像解像度とトレーニングセットサイズが精度に与える影響を評価する。
論文 参考訳(メタデータ) (2020-09-18T00:12:33Z) - Synthesizing lesions using contextual GANs improves breast cancer
classification on mammograms [0.4297070083645048]
本稿では, マンモグラムの病変を現実的に合成し, 除去するデータ拡張のための, GANモデルを提案する。
自己注意と半教師付き学習コンポーネントにより、U-netベースのアーキテクチャは高解像度(256x256px)の出力を生成することができる。
論文 参考訳(メタデータ) (2020-05-29T21:23:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。