論文の概要: Multimodal Survival Modeling and Fairness-Aware Clinical Machine Learning for 5-Year Breast Cancer Risk Prediction
- arxiv url: http://arxiv.org/abs/2602.21648v1
- Date: Wed, 25 Feb 2026 07:20:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.742062
- Title: Multimodal Survival Modeling and Fairness-Aware Clinical Machine Learning for 5-Year Breast Cancer Risk Prediction
- Title(参考訳): 5年乳がんリスク予測のためのマルチモーダル生存モデルと公平性を考慮した臨床機械学習
- Authors: Toktam Khatibi,
- Abstract要約: 乳癌における5年間の生存予測のための,完全再現可能な機械学習フレームワークを提案する。
我々は,METABRICコホートから高次元転写・複写数変化(CNA)の特徴を臨床変数と統合した。
ROC曲線(AUC)、平均精度(AP)、キャリブレーション曲線、ブライアスコア、ブートストラップの95%の信頼区間を用いて評価を行った。
- 参考スコア(独自算出の注目度): 4.750682174151462
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical risk prediction models often underperform in real-world settings due to poor calibration, limited transportability, and subgroup disparities. These challenges are amplified in high-dimensional multimodal cancer datasets characterized by complex feature interactions and a p >> n structure. We present a fully reproducible multimodal machine learning framework for 5-year overall survival prediction in breast cancer, integrating clinical variables with high-dimensional transcriptomic and copy-number alteration (CNA) features from the METABRIC cohort. After variance- and sparsity-based filtering and dimensionality reduction, models were trained using stratified train/validation/test splits with validation-based hyperparameter tuning. Two survival approaches were compared: an elastic-net regularized Cox model (CoxNet) and a gradient-boosted survival tree model implemented using XGBoost. CoxNet provides embedded feature selection and stable estimation, whereas XGBoost captures nonlinear effects and higher-order interactions. Performance was assessed using time-dependent area under the ROC curve (AUC), average precision (AP), calibration curves, Brier score, and bootstrapped 95 percent confidence intervals. CoxNet achieved validation and test AUCs of 98.3 and 96.6, with AP values of 90.1 and 80.4. XGBoost achieved validation and test AUCs of 98.6 and 92.5, with AP values of 92.5 and 79.9. Fairness diagnostics showed stable discrimination across age groups, estrogen receptor status, molecular subtypes, and menopausal state. This work introduces a governance-oriented multimodal survival framework emphasizing calibration, fairness auditing, robustness, and reproducibility for high-dimensional clinical machine learning.
- Abstract(参考訳): 臨床リスク予測モデルは、キャリブレーションの貧弱さ、輸送可能性の制限、サブグループの格差により、現実の環境では性能が劣ることが多い。
これらの課題は、複雑な特徴相互作用とp>>n構造を特徴とする高次元マルチモーダル癌データセットで増幅される。
乳がんにおける5年間の生存予測のための完全再現可能なマルチモーダル機械学習フレームワークを提案し,METABRICコホートからの高次元転写・複写数変化(CNA)特徴と臨床変数を統合した。
分散および疎性に基づくフィルタリングと次元性低減の後, モデルでは, 階層化列車/バリデーション/テスト分割と検証に基づくハイパーパラメータチューニングを用いてモデルを訓練した。
弾性ネット正規化コックスモデル(CoxNet)とXGBoostを用いて実装された勾配型生存木モデルの比較を行った。
CoxNetは組み込まれた特徴の選択と安定した推定を提供するが、XGBoostは非線形効果と高次相互作用を捉えている。
ROC曲線(AUC)、平均精度(AP)、キャリブレーション曲線、ブライアスコア、ブートストラップの95%の信頼区間を用いて評価を行った。
CoxNet は 98.3 と 96.6 の AUC の検証とテストを行い、AP の値は 90.1 と 80.4 である。
XGBoost は 98.6 と 92.5 の AUC の検証と試験を行い、AP の値は 92.5 と 79.9 である。
フェアネス診断では,年齢群,エストロゲン受容体,分子サブタイプ,閉経状態の順に,安定した鑑別が認められた。
本研究は, 高次元臨床機械学習における校正, 公正監査, 堅牢性, 再現性を重視したガバナンス指向型マルチモーダルサバイバルフレームワークを提案する。
関連論文リスト
- Transparent Early ICU Mortality Prediction with Clinical Transformer and Per-Case Modality Attribution [42.85462513661566]
ICU滞在後48時間から, 生理的時系列測定と非構造的臨床記録とを融合した, 軽量で透明なマルチモーダルアンサンブルを提案する。
ロジスティック回帰モデルは、バイタル用双方向LSTMとノート用微調整された臨床ModernBERT変換器の2つのモード固有モデルからの予測を組み合わせる。
MIMIC-IIIベンチマークでは、遅延融合アンサンブルは、よく校正された予測を維持しながら、最高の単一モデルに対する差別を改善する。
論文 参考訳(メタデータ) (2025-11-19T20:11:49Z) - An Explainable and Fair AI Tool for PCOS Risk Assessment: Calibration, Subgroup Equity, and Interactive Clinical Deployment [0.10026496861838446]
本稿では,多嚢胞性卵巣症候群(PCOS)の予測のための,公平で解釈可能な機械学習フレームワークを提案する。
このフレームワークは、SHAPに基づく特徴属性と人口統計監査を統合し、予測的説明と観察的差異を関連付ける。
StreamlitベースのWebインターフェースは、リアルタイムPCOSリスク評価、ロッテルダム基準評価、インタラクティブな「What-if」分析を可能にする。
論文 参考訳(メタデータ) (2025-11-08T16:14:56Z) - Methodology for Comparing Machine Learning Algorithms for Survival Analysis [55.65997641180011]
生存分析のための6つの機械学習モデルを評価した。
XGB-AFTは最高性能(C-Index = 0.7618; IPCW = 0.7532、GBSAとRCF)を達成した。
論文 参考訳(メタデータ) (2025-10-28T14:42:28Z) - Automatic Cough Analysis for Non-Small Cell Lung Cancer Detection [33.37223681850477]
非小細胞肺癌(NSCLC)の早期発見は患者の予後改善に重要である。
本研究では,NSCLC患者と健常者との鑑別のためのスクリーニングツールとして,自動コークス分析の利用について検討する。
記録は、サポートベクタマシン(SVM)やXGBoostといった機械学習技術を用いて分析された。
論文 参考訳(メタデータ) (2025-07-25T11:30:22Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - BioFusionNet: Deep Learning-Based Survival Risk Stratification in ER+ Breast Cancer Through Multifeature and Multimodal Data Fusion [16.83901927767791]
画像から得られる特徴を遺伝的・臨床的データと融合して全体像を得る深層学習フレームワークであるBioFusionNetを提案する。
本モデルでは, 平均一致率0.77, 曲線0.84の時間依存領域を達成し, 最先端の手法より優れていた。
論文 参考訳(メタデータ) (2024-02-16T14:19:33Z) - Bag of Tricks for Long-Tailed Multi-Label Classification on Chest X-Rays [40.11576642444264]
本報告では,ICCV CVAMD 2023 CXR-LT コンペティションにおけるソリューションの概要について述べる。
我々は,CXR診断の有効性を,いくつかの先進的な設計を統合することで実証的に検討した。
私たちのフレームワークは最終的に、競争テストセットで0.349 mAPを獲得し、トップ5にランクインしました。
論文 参考訳(メタデータ) (2023-08-17T08:25:55Z) - CIRCA: comprehensible online system in support of chest X-rays-based
COVID-19 diagnosis [37.41181188499616]
深層学習技術は、新型コロナウイルスの迅速検出と疾患の進行のモニタリングに役立つ。
5つの異なるデータセットを使用して、モデルトレーニングのための23の799 CXRの代表的なデータセットを構築した。
The U-Net-based model was developed to identified a clinically relevant region of the CXR。
論文 参考訳(メタデータ) (2022-10-11T13:30:34Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。