論文の概要: Fairness Evaluation of Risk Estimation Models for Lung Cancer Screening
- arxiv url: http://arxiv.org/abs/2512.22242v1
- Date: Tue, 23 Dec 2025 19:57:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:29.925342
- Title: Fairness Evaluation of Risk Estimation Models for Lung Cancer Screening
- Title(参考訳): 肺癌検診におけるリスク推定モデルの公平性評価
- Authors: Shaurya Gaur, Michel Vitale, Alessa Hering, Johan Kwisthout, Colin Jacobs, Lena Philipp, Fennie van der Graaf,
- Abstract要約: 肺がん検診における2つの深層学習リスク推定モデルにおいて,潜在的な性能格差と公平性を評価する。
NLST(National Lung Screening Trial)のデータに基づいて、モデルが訓練された。
統計学的に有意なAUROC差は,女性(0.88, 95% CI: 0.86, 0.90)と男性(0.81, 95% CI: 0.78, 0.84, p .001)にみられた。
90%の特異性で、Venkadesh21は黒人(0.39, 95% CI: 0.23, 0.59)の感度を白人(0.69, 95% CI: 0.65)よりも低い値を示した。
- 参考スコア(独自算出の注目度): 0.6974609493696966
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lung cancer is the leading cause of cancer-related mortality in adults worldwide. Screening high-risk individuals with annual low-dose CT (LDCT) can support earlier detection and reduce deaths, but widespread implementation may strain the already limited radiology workforce. AI models have shown potential in estimating lung cancer risk from LDCT scans. However, high-risk populations for lung cancer are diverse, and these models' performance across demographic groups remains an open question. In this study, we drew on the considerations on confounding factors and ethically significant biases outlined in the JustEFAB framework to evaluate potential performance disparities and fairness in two deep learning risk estimation models for lung cancer screening: the Sybil lung cancer risk model and the Venkadesh21 nodule risk estimator. We also examined disparities in the PanCan2b logistic regression model recommended in the British Thoracic Society nodule management guideline. Both deep learning models were trained on data from the US-based National Lung Screening Trial (NLST), and assessed on a held-out NLST validation set. We evaluated AUROC, sensitivity, and specificity across demographic subgroups, and explored potential confounding from clinical risk factors. We observed a statistically significant AUROC difference in Sybil's performance between women (0.88, 95% CI: 0.86, 0.90) and men (0.81, 95% CI: 0.78, 0.84, p < .001). At 90% specificity, Venkadesh21 showed lower sensitivity for Black (0.39, 95% CI: 0.23, 0.59) than White participants (0.69, 95% CI: 0.65, 0.73). These differences were not explained by available clinical confounders and thus may be classified as unfair biases according to JustEFAB. Our findings highlight the importance of improving and monitoring model performance across underrepresented subgroups, and further research on algorithmic fairness, in lung cancer screening.
- Abstract(参考訳): 肺がんは、世界中の成人のがん関連死亡の主な原因である。
年1回の低用量CT(LDCT)による高リスク人物のスクリーニングは、早期の発見と死亡率の低減を支援できるが、広範な実施は、既に限られた放射線学の労働力を圧迫する可能性がある。
AIモデルはLDCTスキャンから肺がんリスクを推定する可能性を示している。
しかし、肺がんのリスクの高い個体数は多様であり、これらのモデルの性能は人口統計学的に明らかな問題である。
本研究は,肺がん検診における2つの深層学習リスク推定モデルであるSybil lung cancer risk modelとVenkadesh21 nodule risk estimatorにおける潜在的なパフォーマンス格差と公平性を評価するために,JustEFABフレームワークで概説された要因と倫理的に有意なバイアスについて考察した。
また,PanCan2bのロジスティック回帰モデルにおける相違についても検討した。
どちらのディープラーニングモデルも、米国国立肺スクリーニング試験(NLST)のデータに基づいてトレーニングされ、保持されたNLST検証セットに基づいて評価された。
AUROC, 感受性, 特異性について検討し, 臨床リスク因子との相関について検討した。
統計学的に有意なAUROC差がみられ, 女性(0.88, 95% CI: 0.86, 0.90)と男性(0.81, 95% CI: 0.78, 0.84, p < .001)とでは, 女性(0.88, 95% CI: 0.86, 0.90)と男性(0.81, 95% CI: 0.78, 0.84, p < .001)の差が認められた。
90%の特異性で、Venkadesh21は黒人(0.39, 95% CI: 0.23, 0.59)の感度を白人(0.69, 95% CI: 0.65, 0.73)より低くした。
これらの違いは、利用可能な臨床共同設立者によって説明されず、JustEFABによると不公平なバイアスに分類される可能性がある。
肺がん検診における非表現サブグループ間のモデル性能の改善とモニタリングの重要性,さらにアルゴリズム的公正性について検討した。
関連論文リスト
- Subgroup Performance of a Commercial Digital Breast Tomosynthesis Model for Breast Cancer Detection [5.089670339445636]
本研究では,163,449検診大振り返りコホートにおけるLunit INSIGHTモデルの粒度評価を行った。
成績は人口統計学的に良好であったが,非浸潤性癌では有意に低い成績を示した。
論文 参考訳(メタデータ) (2025-03-17T17:17:36Z) - A Transformer-based survival model for prediction of all-cause mortality in heart failure patients: a multi-cohort study [5.831730826863567]
心不全患者の36カ月の死亡を予測できるトランスフォーマーベースのAIモデルであるTRiskを開発した。
英国では1,418例の心不全403,534例(40~90歳)について検討した。
論文 参考訳(メタデータ) (2025-03-16T01:53:50Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Pulmonologists-Level lung cancer detection based on standard blood test
results and smoking status using an explainable machine learning approach [2.545682175108217]
肺癌(LC)は、主に後期診断によるがん関連死亡の主な原因である。
近年, 機械学習は, 様々な疾患の発見を容易にすることによって, 医療において大きな可能性を秘めている。
LC検出のための動的アンサンブル選択(DES)に基づくMLモデルを開発した。
論文 参考訳(メタデータ) (2024-02-14T22:00:57Z) - Prediction of Breast Cancer Recurrence Risk Using a Multi-Model Approach
Integrating Whole Slide Imaging and Clinicopathologic Features [0.6679306163028237]
本研究の目的は,スライド画像全体と臨床病理学的データを分析し,関連する乳癌再発リスクを予測するマルチモデルアプローチを開発することである。
提案手法では,特徴抽出に畳み込みニューラルネットワーク,コンテキストアグリゲーションに視覚変換器を用いる。
論文 参考訳(メタデータ) (2024-01-28T23:33:56Z) - Development and external validation of a lung cancer risk estimation
tool using gradient-boosting [3.200615329024819]
肺がんは世界中で死亡の重大な原因であり、早期発見が生存率の向上に重要であることを強調している。
我々は,PLCOがんスクリーニング試験のデータに基づいて学習し,NLSTで検証する機械学習(ML)ツールを提案する。
開発されたMLツールは、5年以内に肺がんを発症する可能性を推定するための無償のWebアプリケーションを提供する。
論文 参考訳(メタデータ) (2023-08-23T15:25:17Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Automated Quantification of CT Patterns Associated with COVID-19 from
Chest CT [48.785596536318884]
提案法は,非造影胸部CTを入力として,病変,肺,葉を3次元に分割する。
この方法では、肺の重症度と葉の関与度を2つの組み合わせて測定し、COVID-19の異常度と高不透明度の存在度を定量化する。
このアルゴリズムの評価は、カナダ、ヨーロッパ、米国からの200人の参加者(感染者100人、健康管理100人)のCTで報告されている。
論文 参考訳(メタデータ) (2020-04-02T21:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。