論文の概要: A novel interpretable machine learning system to generate clinical risk
scores: An application for predicting early mortality or unplanned
readmission in a retrospective cohort study
- arxiv url: http://arxiv.org/abs/2201.03291v1
- Date: Mon, 10 Jan 2022 11:22:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-11 19:23:40.257518
- Title: A novel interpretable machine learning system to generate clinical risk
scores: An application for predicting early mortality or unplanned
readmission in a retrospective cohort study
- Title(参考訳): 臨床リスクスコアを生成する新しい解釈可能な機械学習システム : 振り返りコホート研究における早期死亡率および未計画再帰予測への応用
- Authors: Yilin Ning, Siqi Li, Marcus Eng Hock Ong, Feng Xie, Bibhas
Chakraborty, Daniel Shu Wei Ting, Nan Liu
- Abstract要約: 本稿では,Shapley変数重要クラウド(ShapleyVIC)を用いた頑健で解釈可能な変数選択手法を提案する。
提案手法は,詳細な推論と透過的な変数選択のための総合的な変数寄与を評価し,可視化する。
早死にまたは未計画の可読性の研究において、ShapleyVICは41の候補変数のうち6つを選択し、良好な性能のモデルを作った。
- 参考スコア(独自算出の注目度): 7.648642297930807
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Risk scores are widely used for clinical decision making and commonly
generated from logistic regression models. Machine-learning-based methods may
work well for identifying important predictors, but such 'black box' variable
selection limits interpretability, and variable importance evaluated from a
single model can be biased. We propose a robust and interpretable variable
selection approach using the recently developed Shapley variable importance
cloud (ShapleyVIC) that accounts for variability across models. Our approach
evaluates and visualizes overall variable contributions for in-depth inference
and transparent variable selection, and filters out non-significant
contributors to simplify model building steps. We derive an ensemble variable
ranking from variable contributions, which is easily integrated with an
automated and modularized risk score generator, AutoScore, for convenient
implementation. In a study of early death or unplanned readmission, ShapleyVIC
selected 6 of 41 candidate variables to create a well-performing model, which
had similar performance to a 16-variable model from machine-learning-based
ranking.
- Abstract(参考訳): リスクスコアは臨床意思決定に広く用いられ、ロジスティック回帰モデルから一般的に生成される。
機械学習に基づく手法は重要な予測器を特定するのにうまく機能するが、このような「ブラックボックス」変数の選択は解釈可能性を制限する。
本稿では、最近開発されたShapley変数重要クラウド(ShapleyVIC)を用いて、モデル間のばらつきを考慮した頑健で解釈可能な変数選択手法を提案する。
提案手法は,詳細な推論と透過的な変数選択のための全体的な変数コントリビューションを評価し,非重要なコントリビュータをフィルタリングし,モデル構築手順を単純化する。
本稿では,自動的かつモジュール化されたリスクスコア生成器であるAutoScoreと簡単に統合できる可変コントリビューションから,アンサンブル変数ランキングを導出する。
早期死亡または未計画の再送の研究において、シャプリービッチは41の候補変数のうち6つを選択して、機械学習に基づくランキングから16変数のモデルに類似したパフォーマンスの優れたモデルを作成した。
関連論文リスト
- Model-independent variable selection via the rule-based variable priority [1.2771542695459488]
モデルに依存しない新しいアプローチである可変優先度(VarPro)を導入する。
VarProは、人工データを生成したり、予測エラーを評価することなく、ルールを活用する。
VarProはノイズ変数に対して一貫したフィルタリング特性を持つことを示す。
論文 参考訳(メタデータ) (2024-09-13T17:32:05Z) - Diversified Batch Selection for Training Acceleration [68.67164304377732]
オンラインバッチ選択として知られる一般的な研究ラインでは、トレーニングプロセス中の情報サブセットの選択について検討している。
バニラ参照モデルフリーメソッドは、独立してデータをサンプリング的にスコア付けし、選択する。
DivBS(Diversified Batch Selection)を提案する。
論文 参考訳(メタデータ) (2024-06-07T12:12:20Z) - IGANN Sparse: Bridging Sparsity and Interpretability with Non-linear Insight [4.010646933005848]
IGANN Sparseは、一般化された加法モデルのファミリーから生まれた、新しい機械学習モデルである。
トレーニング中の非線形特徴選択プロセスを通じて、スパシティを促進する。
これにより、予測性能を犠牲にすることなく、モデル空間の改善による解釈可能性を保証する。
論文 参考訳(メタデータ) (2024-03-17T22:44:36Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Flexible variable selection in the presence of missing data [0.0]
本稿では,非パラメトリックな変数選択アルゴリズムと多重計算を組み合わせることで,非ランダムなデータが存在する場合のフレキシブルなパネルの開発を行う。
提案手法の動作特性は良好であり,より高い分類性能と可変選択性能を有するパネルが得られた。
論文 参考訳(メタデータ) (2022-02-25T21:41:03Z) - Autoregressive Quantile Flows for Predictive Uncertainty Estimation [7.184701179854522]
高次元変数上の確率モデルの柔軟なクラスである自己回帰量子フローを提案する。
これらのモデルは、適切なスコアリングルールに基づいて、新しい目的を用いて訓練された自己回帰フローの例である。
論文 参考訳(メタデータ) (2021-12-09T01:11:26Z) - Variable selection with missing data in both covariates and outcomes:
Imputation and machine learning [1.0333430439241666]
欠落したデータ問題は、健康研究で普遍的です。
機械学習はパラメトリックな仮定を弱める。
XGBoostとBARTは、さまざまな設定で最高のパフォーマンスを発揮します。
論文 参考訳(メタデータ) (2021-04-06T20:18:29Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。