Fugu-MT 論文翻訳(概要): Computing the Hazard Ratios Associated with Explanatory Variables Using Machine Learning Models of Survival Data

論文の概要: Computing the Hazard Ratios Associated with Explanatory Variables Using Machine Learning Models of Survival Data

arxiv url: http://arxiv.org/abs/2102.00637v1
Date: Mon, 1 Feb 2021 05:02:31 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-05 07:51:53.221917
Title: Computing the Hazard Ratios Associated with Explanatory Variables Using Machine Learning Models of Survival Data
Title（参考訳）: 生存データの機械学習モデルを用いた説明変数に関連する危険率の計算
Authors: Sameer Sundrani and James Lu
Abstract要約: 本稿では,木に基づく機械学習モデルからハザード比を計算する新しい手法について述べる。大腸癌,乳がん,膵がんの3種類の生存データを用いて検討した。
参考スコア（独自算出の注目度）: 0.21320960069210473
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Purpose: The application of Cox Proportional Hazards (CoxPH) models to survival data and the derivation of Hazard Ratio (HR) is well established. While nonlinear, tree-based Machine Learning (ML) models have been developed and applied to the survival analysis, no methodology exists for computing HRs associated with explanatory variables from such models. We describe a novel way to compute HRs from tree-based ML models using the Shapley additive explanation (SHAP) values, which is a locally accurate and consistent methodology to quantify explanatory variables' contribution to predictions. Methods: We used three sets of publicly available survival data consisting of patients with colon, breast or pan cancer and compared the performance of CoxPH to the state-of-art ML model, XGBoost. To compute the HR for explanatory variables from the XGBoost model, the SHAP values were exponentiated and the ratio of the means over the two subgroups calculated. The confidence interval was computed via bootstrapping the training data and generating the ML model 1000 times. Across the three data sets, we systematically compared HRs for all explanatory variables. Open-source libraries in Python and R were used in the analyses. Results: For the colon and breast cancer data sets, the performance of CoxPH and XGBoost were comparable and we showed good consistency in the computed HRs. In the pan-cancer dataset, we showed agreement in most variables but also an opposite finding in two of the explanatory variables between the CoxPH and XGBoost result. Subsequent Kaplan-Meier plots supported the finding of the XGBoost model. Conclusion: Enabling the derivation of HR from ML models can help to improve the identification of risk factors from complex survival datasets and enhance the prediction of clinical trial outcomes.
Abstract（参考訳）: 目的: Cox Proportional Hazards (CoxPH) モデルの生存データへの適用, および Hazard Ratio (HR) の導出が良好に確立されている。木をベースとした非線形機械学習(ML)モデルが生存分析に適用されているが、これらのモデルから説明変数に関連付けられたHRを計算するための方法論は存在しない。予測に対する説明変数の寄与を定量化する局所的正確で一貫性のある手法であるShapley additive explanation (SHAP)値を用いて,木ベースのMLモデルからHRを計算する新しい方法を提案する。方法: 大腸癌、乳癌、膵臓癌の患者から得られた3組の生存データを用いて、CoxPHの性能を最先端のMLモデルであるXGBoostと比較した。 XGBoostモデルから説明変数のHRを計算するために、SHAP値は指数化され、2つのサブグループの平均の比率が計算された。信頼区間は、トレーニングデータをブートストラップし、MLモデルを1000回生成することで計算された。 3つのデータセット全体で、すべての説明変数のHRを体系的に比較した。 PythonとRのオープンソースライブラリが分析に使用された。結果: 大腸癌群と乳癌群では, CoxPH と XGBoost のパフォーマンスは同等であり, HR の整合性は良好であった。 Pan-cancerデータセットでは、ほとんどの変数の一致を示しましたが、CoxPHとXGBoostの結果の間の2つの説明変数の反対の発見も示しました。その後のKaplan-MeierプロットはXGBoostモデルの発見を支持した。結論: MLモデルからのHRの導出は,複雑な生存データセットからの危険因子の同定を改善し,臨床試験の結果を予測するのに役立つ。

関連論文リスト

Methodology for Comparing Machine Learning Algorithms for Survival Analysis [55.65997641180011]
生存分析のための6つの機械学習モデルを評価した。 XGB-AFTは最高性能(C-Index = 0.7618; IPCW = 0.7532、GBSAとRCF)を達成した。
論文参考訳（メタデータ） (2025-10-28T14:42:28Z)
Nonparametric Data Attribution for Diffusion Models [57.820618036556084]
生成モデルのデータ属性は、個々のトレーニング例がモデル出力に与える影響を定量化する。生成画像とトレーニング画像のパッチレベルの類似性によって影響を測定する非パラメトリック属性法を提案する。
論文参考訳（メタデータ） (2025-10-16T03:37:16Z)
DUPRE: Data Utility Prediction for Efficient Data Valuation [49.60564885180563]
Data Shapleyのような協調ゲーム理論に基づくデータ評価では、データユーティリティを評価し、複数のデータサブセットに対してMLモデルを再トレーニングする必要がある。我々のフレームワークである textttDUPRE は、モデル再学習による評価ではなく、データユーティリティを予測することによって、サブセット評価当たりのコストを削減できる代替手法を採用しています。具体的には、いくつかのデータサブセットのデータユーティリティを評価すると、textttDUPREは、他のすべてのデータサブセットの有用性を予測するために、emphGaussianプロセス(GP)回帰モデルに適合する。
論文参考訳（メタデータ） (2025-02-22T08:53:39Z)
Modeling Long Sequences in Bladder Cancer Recurrence: A Comparative Evaluation of LSTM,Transformer,and Mamba [0.0]
本研究では,Cox比例ハザードモデルを用いて,時系列データを扱う深層学習モデルの利点を統合する。 LSTM-Coxモデルは、TransformerやMambaといった新しいモデルにまたがる、リカレントなデータ解析と特徴抽出のための堅牢で効率的な方法である。
論文参考訳（メタデータ） (2024-05-28T18:38:15Z)
Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文参考訳（メタデータ） (2024-03-03T04:21:21Z)
ssVERDICT: Self-Supervised VERDICT-MRI for Enhanced Prostate Tumour Characterisation [2.755232740505053]
トレーニングデータなしでVERDICT推定パラメータマップを適合させる自己教師型ニューラルネットワーク。本研究では,SsVERDICTの性能を拡散MRIモデルに適合する2つの確立されたベースライン法と比較する。
論文参考訳（メタデータ） (2023-09-12T14:31:33Z)
ecpc: An R-package for generic co-data models for high-dimensional prediction [0.0]
R-package ecpcはもともと、様々な、おそらく複数のコデータソースに対応していた。本稿では,汎用コデータモデルのための手法とソフトウェアの拡張について述べる。 R-package squeezyにより,リッジのペナルティが弾性ネットペナルティにどのように変換されるかを示す。
論文参考訳（メタデータ） (2022-05-16T12:55:19Z)
Mixed Effects Neural ODE: A Variational Approximation for Analyzing the Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文参考訳（メタデータ） (2022-02-18T22:41:51Z)
A new LDA formulation with covariates [3.1690891866882236]
ラテント・ディリクレ・アロケーション・モデルは混合メンバーシップ・クラスタを作成する一般的な方法である。共変量を含むLDAモデルの新たな定式化を提案する。モデルパラメータを推定するためにギブスサンプリングアルゴリズムを用いてスライスサンプリングを行う。このモデルは,コロナウイルスのテキストマイニング,雑貨買い物かごの分析,バロコロラド島(パナマ)の樹木種の生態という,3つの異なる領域の実際のデータセットを用いて説明されている。
論文参考訳（メタデータ） (2022-02-18T19:58:24Z)
Multi-modality fusion using canonical correlation analysis methods: Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文参考訳（メタデータ） (2021-11-27T21:18:01Z)
X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。両世界の力を生かすために,我々は新しいX-モデルを提案する。 X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文参考訳（メタデータ） (2021-10-09T13:56:48Z)
Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2021-04-19T12:26:26Z)
Bootstrapping Your Own Positive Sample: Contrastive Learning With Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。 EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文参考訳（メタデータ） (2021-04-07T06:02:04Z)
Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文参考訳（メタデータ） (2020-10-12T03:27:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。