論文の概要: Computing the Hazard Ratios Associated with Explanatory Variables Using
Machine Learning Models of Survival Data
- arxiv url: http://arxiv.org/abs/2102.00637v1
- Date: Mon, 1 Feb 2021 05:02:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-05 07:51:53.221917
- Title: Computing the Hazard Ratios Associated with Explanatory Variables Using
Machine Learning Models of Survival Data
- Title(参考訳): 生存データの機械学習モデルを用いた説明変数に関連する危険率の計算
- Authors: Sameer Sundrani and James Lu
- Abstract要約: 本稿では,木に基づく機械学習モデルからハザード比を計算する新しい手法について述べる。
大腸癌,乳がん,膵がんの3種類の生存データを用いて検討した。
- 参考スコア(独自算出の注目度): 0.21320960069210473
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Purpose: The application of Cox Proportional Hazards (CoxPH) models to
survival data and the derivation of Hazard Ratio (HR) is well established.
While nonlinear, tree-based Machine Learning (ML) models have been developed
and applied to the survival analysis, no methodology exists for computing HRs
associated with explanatory variables from such models. We describe a novel way
to compute HRs from tree-based ML models using the Shapley additive explanation
(SHAP) values, which is a locally accurate and consistent methodology to
quantify explanatory variables' contribution to predictions.
Methods: We used three sets of publicly available survival data consisting of
patients with colon, breast or pan cancer and compared the performance of CoxPH
to the state-of-art ML model, XGBoost. To compute the HR for explanatory
variables from the XGBoost model, the SHAP values were exponentiated and the
ratio of the means over the two subgroups calculated. The confidence interval
was computed via bootstrapping the training data and generating the ML model
1000 times. Across the three data sets, we systematically compared HRs for all
explanatory variables. Open-source libraries in Python and R were used in the
analyses.
Results: For the colon and breast cancer data sets, the performance of CoxPH
and XGBoost were comparable and we showed good consistency in the computed HRs.
In the pan-cancer dataset, we showed agreement in most variables but also an
opposite finding in two of the explanatory variables between the CoxPH and
XGBoost result. Subsequent Kaplan-Meier plots supported the finding of the
XGBoost model.
Conclusion: Enabling the derivation of HR from ML models can help to improve
the identification of risk factors from complex survival datasets and enhance
the prediction of clinical trial outcomes.
- Abstract(参考訳): 目的: Cox Proportional Hazards (CoxPH) モデルの生存データへの適用, および Hazard Ratio (HR) の導出が良好に確立されている。
木をベースとした非線形機械学習(ML)モデルが生存分析に適用されているが、これらのモデルから説明変数に関連付けられたHRを計算するための方法論は存在しない。
予測に対する説明変数の寄与を定量化する局所的正確で一貫性のある手法であるShapley additive explanation (SHAP)値を用いて,木ベースのMLモデルからHRを計算する新しい方法を提案する。
方法: 大腸癌、乳癌、膵臓癌の患者から得られた3組の生存データを用いて、CoxPHの性能を最先端のMLモデルであるXGBoostと比較した。
XGBoostモデルから説明変数のHRを計算するために、SHAP値は指数化され、2つのサブグループの平均の比率が計算された。
信頼区間は、トレーニングデータをブートストラップし、MLモデルを1000回生成することで計算された。
3つのデータセット全体で、すべての説明変数のHRを体系的に比較した。
PythonとRのオープンソースライブラリが分析に使用された。
結果: 大腸癌群と乳癌群では, CoxPH と XGBoost のパフォーマンスは同等であり, HR の整合性は良好であった。
Pan-cancerデータセットでは、ほとんどの変数の一致を示しましたが、CoxPHとXGBoostの結果の間の2つの説明変数の反対の発見も示しました。
その後のKaplan-MeierプロットはXGBoostモデルの発見を支持した。
結論: MLモデルからのHRの導出は,複雑な生存データセットからの危険因子の同定を改善し,臨床試験の結果を予測するのに役立つ。
関連論文リスト
- Modeling Long Sequences in Bladder Cancer Recurrence: A Comparative Evaluation of LSTM,Transformer,and Mamba [0.0]
本研究では,Cox比例ハザードモデルを用いて,時系列データを扱う深層学習モデルの利点を統合する。
LSTM-Coxモデルは、TransformerやMambaといった新しいモデルにまたがる、リカレントなデータ解析と特徴抽出のための堅牢で効率的な方法である。
論文 参考訳(メタデータ) (2024-05-28T18:38:15Z) - Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。
これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文 参考訳(メタデータ) (2024-03-03T04:21:21Z) - ssVERDICT: Self-Supervised VERDICT-MRI for Enhanced Prostate Tumour
Characterisation [2.755232740505053]
トレーニングデータなしでVERDICT推定パラメータマップを適合させる自己教師型ニューラルネットワーク。
本研究では,SsVERDICTの性能を拡散MRIモデルに適合する2つの確立されたベースライン法と比較する。
論文 参考訳(メタデータ) (2023-09-12T14:31:33Z) - ecpc: An R-package for generic co-data models for high-dimensional
prediction [0.0]
R-package ecpcはもともと、様々な、おそらく複数のコデータソースに対応していた。
本稿では,汎用コデータモデルのための手法とソフトウェアの拡張について述べる。
R-package squeezyにより,リッジのペナルティが弾性ネットペナルティにどのように変換されるかを示す。
論文 参考訳(メタデータ) (2022-05-16T12:55:19Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - A new LDA formulation with covariates [3.1690891866882236]
ラテント・ディリクレ・アロケーション・モデルは混合メンバーシップ・クラスタを作成する一般的な方法である。
共変量を含むLDAモデルの新たな定式化を提案する。
モデルパラメータを推定するためにギブスサンプリングアルゴリズムを用いてスライスサンプリングを行う。
このモデルは,コロナウイルスのテキストマイニング,雑貨買い物かごの分析,バロコロラド島(パナマ)の樹木種の生態という,3つの異なる領域の実際のデータセットを用いて説明されている。
論文 参考訳(メタデータ) (2022-02-18T19:58:24Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。
生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。
我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-04-19T12:26:26Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。