論文の概要: Considerations for Distribution Shift Robustness of Diagnostic Models in Healthcare
- arxiv url: http://arxiv.org/abs/2410.19575v1
- Date: Fri, 25 Oct 2024 14:13:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:37:48.663465
- Title: Considerations for Distribution Shift Robustness of Diagnostic Models in Healthcare
- Title(参考訳): 医療における診断モデルの分布変化ロバスト性に関する考察
- Authors: Arno Blaas, Adam Goliński, Andrew Miller, Luca Zappella, Jörn-Henrik Jacobsen, Christina Heinze-Deml,
- Abstract要約: 健康のための応用MLの分野では、患者に関する情報を考慮せずに$X$から$Y$を予測することが一般的である。
本研究では,医療環境に共通するデータ生成機構を強調し,因果関係の文献による最近の理論的結果を用いて,堅牢な予測モデルを構築する方法について論じる。
- 参考スコア(独自算出の注目度): 10.393967785465536
- License:
- Abstract: We consider robustness to distribution shifts in the context of diagnostic models in healthcare, where the prediction target $Y$, e.g., the presence of a disease, is causally upstream of the observations $X$, e.g., a biomarker. Distribution shifts may occur, for instance, when the training data is collected in a domain with patients having particular demographic characteristics while the model is deployed on patients from a different demographic group. In the domain of applied ML for health, it is common to predict $Y$ from $X$ without considering further information about the patient. However, beyond the direct influence of the disease $Y$ on biomarker $X$, a predictive model may learn to exploit confounding dependencies (or shortcuts) between $X$ and $Y$ that are unstable under certain distribution shifts. In this work, we highlight a data generating mechanism common to healthcare settings and discuss how recent theoretical results from the causality literature can be applied to build robust predictive models. We theoretically show why ignoring covariates as well as common invariant learning approaches will in general not yield robust predictors in the studied setting, while including certain covariates into the prediction model will. In an extensive simulation study, we showcase the robustness (or lack thereof) of different predictors under various data generating processes. Lastly, we analyze the performance of the different approaches using the PTB-XL dataset, a public dataset of annotated ECG recordings.
- Abstract(参考訳): 医療における診断モデルの文脈における分布変化に対するロバスト性について考察し,その予測対象であるY$,egは,バイオマーカーであるX$,egを因果的に上流に置いている。
例えば、トレーニングデータが特定の人口統計学的特徴を持つ領域に集められ、モデルが別の人口統計学的グループから患者にデプロイされる場合、分散シフトが発生する可能性がある。
健康のための応用MLの分野では、患者に関する情報を考慮せずに$X$から$Y$を予測することが一般的である。
しかしながら、バイオマーカーの$X$に対する$Y$の直接的な影響を超えて、予測モデルは、特定の分布シフトの下で不安定な$X$と$Y$の間の相反する依存関係(またはショートカット)を活用することを学習することができる。
本研究では,医療環境に共通するデータ生成機構を強調し,因果関係の文献による最近の理論的結果を用いて,堅牢な予測モデルを構築する方法について論じる。
理論的には、共変量や共通不変学習アプローチを無視することは、一般に、ある共変量を予測モデルに含めながら、研究環境では頑健な予測子を得られないことが示される。
本研究では,様々なデータ生成プロセスにおいて,様々な予測器の堅牢性(あるいは欠如)を示す。
最後に、アノテーション付きECG記録の公開データセットであるTB-XLデータセットを用いて、異なるアプローチのパフォーマンスを分析する。
関連論文リスト
- MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - Deep Stable Representation Learning on Electronic Health Records [8.256340233221112]
CHE(Causal Healthcare Embedding)は、診断と処置の依存関係を取り除くことで、突発的な統計的関係を取り除くことを目的としている。
提案手法は,既存の深層学習モデルをEHR上で拡張可能な,フレキシブルなプラグアンドプレイモジュールとして利用できる。
論文 参考訳(メタデータ) (2022-09-03T04:10:45Z) - Comparative Analysis of Machine Learning Approaches to Analyze and
Predict the Covid-19 Outbreak [10.307715136465056]
疫学領域における新型コロナウイルスの流行を予測するための機械学習(ML)アプローチの比較分析を行った。
これらの結果から,短期的政策の意思決定を支援するMLアルゴリズムの利点が明らかになった。
論文 参考訳(メタデータ) (2021-02-11T11:57:33Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Mixture Model Framework for Traumatic Brain Injury Prognosis Using
Heterogeneous Clinical and Outcome Data [3.7363119896212478]
TBIに関連する大きな異種データ型をモデル化する手法を開発する。
このモデルは、人口統計、血液ベースのバイオマーカー、画像検出など、さまざまなデータタイプを含むデータセットでトレーニングされます。
教師なしの学習環境で患者を別々のグループに成層するために使用されます。
論文 参考訳(メタデータ) (2020-12-22T19:31:03Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z) - Hemogram Data as a Tool for Decision-making in COVID-19 Management:
Applications to Resource Scarcity Scenarios [62.997667081978825]
新型コロナウイルス(COVID-19)のパンデミックは世界中の緊急対応システムに挑戦している。
本研究は, 症状患者の血液検査データから得られた機械学習モデルについて述べる。
提案されたモデルでは、新型コロナウイルスqRT-PCRの結果を、高い精度、感度、特異性で症状のある個人に予測することができる。
論文 参考訳(メタデータ) (2020-05-10T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。