論文の概要: Statistical quantification of confounding bias in predictive modelling
- arxiv url: http://arxiv.org/abs/2111.00814v1
- Date: Mon, 1 Nov 2021 10:35:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 00:12:48.483101
- Title: Statistical quantification of confounding bias in predictive modelling
- Title(参考訳): 予測モデルにおける共起バイアスの統計的定量化
- Authors: Tamas Spisak
- Abstract要約: 未確立モデルと完全構築モデルのnull仮説を探索する部分的および完全共創テストを提案する。
このテストは、非正規および非線形依存の予測であっても、I型エラーと高い統計的パワーに対して厳格な制御を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The lack of non-parametric statistical tests for confounding bias
significantly hampers the development of robust, valid and generalizable
predictive models in many fields of research. Here I propose the partial and
full confounder tests, which, for a given confounder variable, probe the null
hypotheses of unconfounded and fully confounded models, respectively. The tests
provide a strict control for Type I errors and high statistical power, even for
non-normally and non-linearly dependent predictions, often seen in machine
learning. Applying the proposed tests on models trained on functional brain
connectivity data from the Human Connectome Project and the Autism Brain
Imaging Data Exchange dataset reveals confounders that were previously
unreported or found to be hard to correct for with state-of-the-art confound
mitigation approaches. The tests, implemented in the package mlconfound
(https://mlconfound.readthedocs.io), can aid the assessment and improvement of
the generalizability and neurobiological validity of predictive models and,
thereby, foster the development of clinically useful machine learning
biomarkers.
- Abstract(参考訳): 非パラメトリックな統計テストの欠如は、多くの研究分野における堅牢で有効で一般化可能な予測モデルの開発を著しく妨げている。
ここでは、ある共同設立変数に対して、未確立モデルと完全構築モデルのヌル仮説をそれぞれ探索する部分的および完全共創テストを提案する。
テストは、機械学習でよく見られる非正規および非線形依存予測においても、タイプiのエラーと高い統計力に対する厳密な制御を提供する。
Human Connectome ProjectとAutism Brain Imaging Data Exchangeのデータセットからトレーニングされた脳の機能的コネクティビティデータに基づいて、提案されたテストを適用することで、これまで報告されていない、あるいは最先端のコンファウンド緩和アプローチで修正が難しい共同創設者が明らかになった。
mlconfound(https://mlconfound.readthedocs.io)パッケージに実装されたこのテストは、予測モデルの一般化性と神経生物学的妥当性の評価と改善を支援し、臨床的に有用な機械学習バイオマーカーの開発を促進する。
関連論文リスト
- Deep Learning Framework with Uncertainty Quantification for Survey Data: Assessing and Predicting Diabetes Mellitus Risk in the American Population [2.3849116823891987]
本稿では,ニューラルネットワーク(NN)モデルを用いた回帰と分類のための一般的な予測フレームワークを提案する。
NHANES 2011-2014コホートのデータを用いて,米国における糖尿病のリスク評価にこの枠組みを適用した。
糖尿病に焦点を当てながら、このNN予測フレームワークは、さまざまな疾患や医療コホートのための臨床モデルを作成するために適応できる。
論文 参考訳(メタデータ) (2024-03-28T18:06:11Z) - Unified Uncertainty Estimation for Cognitive Diagnosis Models [70.46998436898205]
本稿では,幅広い認知診断モデルに対する統一的不確実性推定手法を提案する。
診断パラメータの不確かさをデータ・アスペクトとモデル・アスペクトに分解する。
本手法は有効であり,認知診断の不確実性に関する有用な知見を提供することができる。
論文 参考訳(メタデータ) (2024-03-09T13:48:20Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Targeted-BEHRT: Deep learning for observational causal inference on
longitudinal electronic health records [1.3192560874022086]
RCTが確立したNull causal associationの因果モデリングについて検討した。
本研究では,観測研究用データセットと変換器ベースモデルであるTargeted BEHRTと2倍のロバストな推定手法を開発した。
本モデルでは,高次元EHRにおけるリスク比推定のベンチマークと比較し,RRの精度の高い推定結果が得られた。
論文 参考訳(メタデータ) (2022-02-07T20:05:05Z) - Generalizability of Machine Learning Models: Quantitative Evaluation of
Three Methodological Pitfalls [1.3870303451896246]
いくつかの医用画像データセットを用いてランダムフォレストとディープ畳み込みニューラルネットワークモデルを実装した。
独立仮定の違反はモデル一般化可能性に大きく影響する可能性が示唆された。
不適切なパフォーマンス指標は誤った結論につながる可能性がある。
論文 参考訳(メタデータ) (2022-02-01T05:07:27Z) - Deep Learning in current Neuroimaging: a multivariate approach with
power and type I error control but arguable generalization ability [0.158310730488265]
ディープラーニングアーキテクチャを用いた分類の統計的意義を推定する非パラメトリックフレームワークを提案する。
ラベル置換試験は, クロスバリデーション (CV) と上界補正 (RUB) を併用した再置換を検証法として提案した。
我々は, CV法とRUB法が有意レベルに近い偽陽性率と許容可能な統計的力を提供することを置換試験で発見した。
論文 参考訳(メタデータ) (2021-03-30T21:15:39Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Impact of Medical Data Imprecision on Learning Results [9.379890125442333]
医療応用におけるインプレクションが予測結果に与える影響について検討した。
トレーニング済みのモデルを用いて、患者の甲状腺機能亢進症の将来状態を予測する。
論文 参考訳(メタデータ) (2020-07-24T06:54:57Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。