論文の概要: Copula Based Fusion of Clinical and Genomic Machine Learning Risk Scores for Breast Cancer Risk Stratification
- arxiv url: http://arxiv.org/abs/2511.17605v1
- Date: Tue, 18 Nov 2025 05:59:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.286453
- Title: Copula Based Fusion of Clinical and Genomic Machine Learning Risk Scores for Breast Cancer Risk Stratification
- Title(参考訳): コピュラを基盤とした臨床・ゲノミクス学習リスクスコアの融合による乳癌リスク階層化
- Authors: Agnideep Aich, Sameera Hewage, Md Monzur Murshed,
- Abstract要約: MeTABRICの乳がんコホートを用いて,臨床とゲノム機械学習のリスクスコアの結合関係を直接モデル化することにより,5年間のがん特異的死亡のリスク階層化が向上するか否かを検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clinical and genomic models are both used to predict breast cancer outcomes, but they are often combined using simple linear rules that do not account for how their risk scores relate, especially at the extremes. Using the METABRIC breast cancer cohort, we studied whether directly modeling the joint relationship between clinical and genomic machine learning risk scores could improve risk stratification for 5-year cancer-specific mortality. We created a binary 5-year cancer-death outcome and defined two sets of predictors: a clinical set (demographic, tumor, and treatment variables) and a genomic set (gene-expression $z$-scores). We trained several supervised classifiers, such as Random Forest and XGBoost, and used 5-fold cross-validated predicted probabilities as unbiased risk scores. These scores were converted to pseudo-observations on $(0,1)^2$ to fit Gaussian, Clayton, and Gumbel copulas. Clinical models showed good discrimination (AUC 0.783), while genomic models had moderate performance (AUC 0.681). The joint distribution was best captured by a Gaussian copula (bootstrap $p=0.997$), which suggests a symmetric, moderately strong positive relationship. When we grouped patients based on this relationship, Kaplan-Meier curves showed clear differences: patients who were high-risk in both clinical and genomic scores had much poorer survival than those high-risk in only one set. These results show that copula-based fusion works in real-world cohorts and that considering dependencies between scores can better identify patient subgroups with the worst prognosis.
- Abstract(参考訳): 臨床モデルとゲノムモデルの両方が乳がんの結果を予測するために使用されるが、リスクスコア、特に極端におけるリスクスコアの関連性を考慮しない単純な線形ルールを用いて組み合わせられることが多い。
MeTABRICの乳がんコホートを用いて,臨床とゲノム機械学習のリスクスコアの結合関係を直接モデル化することにより,5年間のがん特異的死亡のリスク階層化が向上するか否かを検討した。
5年連続のがん死判定結果を作成し,臨床セット(デモグラフィー,腫瘍,治療変数)とゲノムセット(遺伝子発現$z$-scores)の2つの予測値を定義した。
我々は、ランダムフォレストやXGBoostなどの教師付き分類器を訓練し、5倍のクロスバリデーション予測確率をバイアスのないリスクスコアとして使用した。
これらのスコアは、ガウス、クレイトン、ガンベルのコプラに合うように、$(0,1)^2$で擬似観測に変換された。
臨床モデルは良好な差別(AUC 0.783)を示し、ゲノムモデルは適度なパフォーマンス(AUC 0.681)を示した。
合同分布はガウスのコプラ (bootstrap $p=0.997$) によって最もよく捉えられ、対称で、適度に強い正の関係が示唆された。
カプラン・マイアー曲線は, 臨床, ゲノミクススコアともに高いリスクを持つ患者は, 1セットでのみ高いリスクを持つ患者よりも生存率が低かった。
これらの結果から,コプラによる核融合は現実世界のコホートで有効であり,スコア間の依存性を考慮することで,患者サブグループと診断しやすくなった。
関連論文リスト
- Methodology for Comparing Machine Learning Algorithms for Survival Analysis [55.65997641180011]
生存分析のための6つの機械学習モデルを評価した。
XGB-AFTは最高性能(C-Index = 0.7618; IPCW = 0.7532、GBSAとRCF)を達成した。
論文 参考訳(メタデータ) (2025-10-28T14:42:28Z) - Multimodal Cardiovascular Risk Profiling Using Self-Supervised Learning of Polysomnography [11.59070680647139]
マルチモーダル信号から意味あるパターンを抽出する自己教師型ディープラーニングモデルを開発した。
心電図による特徴は, 心電図上, 心電図上, 心電図上, 心電図上, 心電図上, 心電図上, 心電図上, 心電図上, 心電図上, 心電図
脳波による特徴は、入所高血圧とCVD死亡の予測であった。
論文 参考訳(メタデータ) (2025-07-11T20:24:10Z) - ECTIL: Label-efficient Computational Tumour Infiltrating Lymphocyte (TIL) assessment in breast cancer: Multicentre validation in 2,340 patients with breast cancer [17.91294880294883]
腫瘍浸潤リンパ球のレベル(TILs)は、(三重複陰性)乳癌の予後因子である。
現在の計算的TILアセスメント(CTA)モデルは、多くの詳細なアノテーションに依存している。
我々は,100倍少ない病理学アノテーションで10分で学習できる,根本的にシンプルなディープラーニングベースモデルを提案する。
論文 参考訳(メタデータ) (2025-01-24T10:28:05Z) - Assessing the risk of recurrence in early-stage breast cancer through H&E stained whole slide images [5.507561997194002]
深層学習を用いて乳癌再発リスクを予測するため,125例のヘマトキシリンおよびエオシン含有全スライド画像(WSI)を解析した。
感度はそれぞれ, 0.857, 0.746, 0.529であり, それぞれ0.816, 0.803, 0.972, ピアソン相関は0.61であった。
論文 参考訳(メタデータ) (2024-06-10T08:51:59Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Prediction of Breast Cancer Recurrence Risk Using a Multi-Model Approach
Integrating Whole Slide Imaging and Clinicopathologic Features [0.6679306163028237]
本研究の目的は,スライド画像全体と臨床病理学的データを分析し,関連する乳癌再発リスクを予測するマルチモデルアプローチを開発することである。
提案手法では,特徴抽出に畳み込みニューラルネットワーク,コンテキストアグリゲーションに視覚変換器を用いる。
論文 参考訳(メタデータ) (2024-01-28T23:33:56Z) - Kernel Cox partially linear regression: building predictive models for
cancer patients' survival [4.230753712933184]
我々はカーネルCox比例ハザード半パラメトリックモデルを構築し、モデルに適合する新しい正規化ニンジン化カーネルマシン(RegGKM)を提案する。
我々はカーネルマシン法を用いて生存率と予測値の複雑な関係を記述し、無関係なパラメトリックおよび非パラメトリック予測値を自動的に除去する。
この結果は、患者を異なる死亡リスクを持つグループに分類し、より良い臨床結果を得るために治療を促進するのに役立つ。
論文 参考訳(メタデータ) (2023-10-11T04:27:54Z) - Pathology-and-genomics Multimodal Transformer for Survival Outcome
Prediction [43.1748594898772]
大腸癌生存予測に病理学とゲノム学的知見を統合したマルチモーダルトランスフォーマー(PathOmics)を提案する。
ギガピクセル全スライド画像における組織ミクロ環境間の内在的相互作用を捉えるための教師なし事前訓練を強調した。
我々は,TCGA大腸癌と直腸癌コホートの両方に対するアプローチを評価し,提案手法は競争力があり,最先端の研究より優れていることを示す。
論文 参考訳(メタデータ) (2023-07-22T00:59:26Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。