論文の概要: Fair and Accurate Prediction with Model Generalization via Deconfounder
in Healthcare
- arxiv url: http://arxiv.org/abs/2308.11819v2
- Date: Thu, 28 Sep 2023 22:42:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-02 17:48:04.024896
- Title: Fair and Accurate Prediction with Model Generalization via Deconfounder
in Healthcare
- Title(参考訳): Deconfounder in Healthcareによるモデル一般化による公正かつ正確な予測
- Authors: Zheng Liu, Xiaohan Li and Philip Yu
- Abstract要約: FLMD(Fair Longitudinal Medical Deconfounder)と呼ばれる新しいモデルを提案する。
FLMDは、縦型Electronic Health Records(EHR)モデリングにおいて、公平性と正確性の両方を達成することを目的としている。
我々は、FLMDの有効性を示すために、2つの実世界のEHRデータセットの総合的な実験を行った。
- 参考スコア(独自算出の注目度): 5.198621505969445
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The fairness issue of clinical data modeling, especially on Electronic Health
Records (EHRs), is of utmost importance due to EHR's complex latent structure
and potential selection bias. It is frequently necessary to mitigate health
disparity while keeping the model's overall accuracy in practice. However,
traditional methods often encounter the trade-off between accuracy and
fairness, as they fail to capture the underlying factors beyond observed data.
To tackle this challenge, we propose a novel model called Fair Longitudinal
Medical Deconfounder (FLMD) that aims to achieve both fairness and accuracy in
longitudinal Electronic Health Records (EHR) modeling. Drawing inspiration from
the deconfounder theory, FLMD employs a two-stage training process. In the
first stage, FLMD captures unobserved confounders for each encounter, which
effectively represents underlying medical factors beyond observed EHR, such as
patient genotypes and lifestyle habits. This unobserved confounder is crucial
for addressing the accuracy/fairness dilemma. In the second stage, FLMD
combines the learned latent representation with other relevant features to make
predictions. By incorporating appropriate fairness criteria, such as
counterfactual fairness, FLMD ensures that it maintains high prediction
accuracy while simultaneously minimizing health disparities. We conducted
comprehensive experiments on two real-world EHR datasets to demonstrate the
effectiveness of FLMD. Apart from the comparison of baseline methods and FLMD
variants in terms of fairness and accuracy, we assessed the performance of all
models on disturbed/imbalanced and synthetic datasets to showcase the
superiority of FLMD across different settings and provide valuable insights
into its capabilities.
- Abstract(参考訳): 臨床データモデリングの公平性の問題、特にElectronic Health Records(EHRs)は、EHRの複雑な潜伏構造と潜在的選択バイアスのために最も重要である。
モデル全体の精度を実際に維持しながら、健康格差を軽減することがしばしば必要である。
しかし、従来の手法は、観測されたデータを超えた基礎となる要因を捉えることができないため、正確さと公平さのトレードオフに遭遇することが多い。
この課題に対処するために、縦型電子健康記録(EHR)モデリングにおける公平性と正確性の両方を達成することを目的とした、Fair Longitudinal Medical Deconfounder(FLMD)と呼ばれる新しいモデルを提案する。
FLMDは2段階のトレーニングプロセスを採用している。
第一段階では、flmdは観察されていない共同創設者を、患者の遺伝子型や生活習慣といった観察されたehr以外の医学的要因を効果的に表わす。
この観察されていない共同創設者は、正確さとフェアネスのジレンマに対処するために不可欠である。
第2段階では、FLMDは学習した潜在表現と他の関連する特徴を組み合わせて予測を行う。
対物公正などの適切な公正基準を取り入れることで、FLMDは健康格差を最小化しつつ高い予測精度を維持することを保証する。
我々は、FLMDの有効性を示すために、2つの実世界のEHRデータセットの総合的な実験を行った。
公平性と正確性の観点からのベースライン法とflmd変種の比較を別にして、乱れ/不均衡/合成データセットにおける全てのモデルの性能を評価し、異なる設定におけるflmdの優位性を示し、その能力に関する貴重な洞察を提供する。
関連論文リスト
- FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - DrFuse: Learning Disentangled Representation for Clinical Multi-Modal
Fusion with Missing Modality and Modal Inconsistency [18.291267748113142]
そこで本研究では,DrFuseを効果的に多モード核融合を実現するために提案する。
モダリティに共通する特徴と各モダリティに特有の特徴を分離することで、モダリティの欠如に対処する。
実世界の大規模データセットMIMIC-IVとMIMIC-CXRを用いて提案手法を検証する。
論文 参考訳(メタデータ) (2024-03-10T12:41:34Z) - FairEHR-CLP: Towards Fairness-Aware Clinical Predictions with Contrastive Learning in Multimodal Electronic Health Records [15.407593899656762]
本報告では,FairEHR-CLPについて述べる。
FairEHR-CLPは2段階のプロセスで動作し、患者の人口統計、縦断データ、臨床ノートを利用する。
サブグループ間での誤差率の差異を効果的に測定する新しい公正度尺度を導入する。
論文 参考訳(メタデータ) (2024-02-01T19:24:45Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Fair Patient Model: Mitigating Bias in the Patient Representation
Learned from the Electronic Health Records [7.467693938220289]
提案モデルをMIMIC-IIIデータセットから34,739名の患者に適用した。
FPMは3つの公正度指標(人口格差、機会差の平等、等化確率比)でベースラインモデルを上回った。
論文 参考訳(メタデータ) (2023-06-05T18:40:35Z) - Mitigating Health Disparities in EHR via Deconfounder [5.511343163506091]
我々は、医療データセットの格差問題に対処する新しいフレームワーク、Parity Medical Deconfounder(PriMeD)を提案する。
PriMeDはCVAE(Conditional Variational Autoencoder)を採用して、観測データに対する潜伏要因(代替共同設立者)を学習する。
論文 参考訳(メタデータ) (2022-10-28T05:16:50Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - EVA: Generating Longitudinal Electronic Health Records Using Conditional
Variational Autoencoders [34.22731849545798]
離散的な EHR の出会いと出会いの特徴を合成するための EHR Variational Autoencoder (EVA) を提案する。
EVAは現実的なシーケンスを生成でき、患者間の個人差を考慮し、特定の疾患条件で条件付けできる。
250,000人以上の患者を含む大規模な現実世界のEHRリポジトリの方法の有用性を評価します。
論文 参考訳(メタデータ) (2020-12-18T02:37:49Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。