論文の概要: Fairness-Optimized Synthetic EHR Generation for Arbitrary Downstream Predictive Tasks
- arxiv url: http://arxiv.org/abs/2406.02510v1
- Date: Tue, 4 Jun 2024 17:29:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-05 15:00:23.993986
- Title: Fairness-Optimized Synthetic EHR Generation for Arbitrary Downstream Predictive Tasks
- Title(参考訳): 任意下流予測タスクのためのフェアネス最適化合成EHR生成
- Authors: Mirza Farhan Bin Tarek, Raphael Poulain, Rahmatollah Beheshti,
- Abstract要約: 本稿では,実EHRデータと整合した合成EHRデータを生成するパイプラインを提案する。
下流タスクと2つの異なるEHRデータセットにまたがるパイプラインの有効性を実証する。
提案したパイプラインは、ヘルスAIアプリケーションの公正性に対処する既存のツールボックスに、広く適用可能な補完ツールを追加することができる。
- 参考スコア(独自算出の注目度): 2.089191490381739
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Among various aspects of ensuring the responsible design of AI tools for healthcare applications, addressing fairness concerns has been a key focus area. Specifically, given the wide spread of electronic health record (EHR) data and their huge potential to inform a wide range of clinical decision support tasks, improving fairness in this category of health AI tools is of key importance. While such a broad problem (that is, mitigating fairness in EHR-based AI models) has been tackled using various methods, task- and model-agnostic methods are noticeably rare. In this study, we aimed to target this gap by presenting a new pipeline that generates synthetic EHR data, which is not only consistent with (faithful to) the real EHR data but also can reduce the fairness concerns (defined by the end-user) in the downstream tasks, when combined with the real data. We demonstrate the effectiveness of our proposed pipeline across various downstream tasks and two different EHR datasets. Our proposed pipeline can add a widely applicable and complementary tool to the existing toolbox of methods to address fairness in health AI applications such as those modifying the design of a downstream model. The codebase for our project is available at https://github.com/healthylaife/FairSynth
- Abstract(参考訳): 医療アプリケーションのためのAIツールの責任ある設計を保証するためのさまざまな側面の中で、公平性に関する懸念に対処することが、重要な焦点となっている。
具体的には、電子健康記録(EHR)データの普及と、幅広い臨床的意思決定支援タスクを通知する大きな可能性を考慮し、このカテゴリの健康AIツールの公平性を向上させることが重要である。
このような広い問題(つまり、EHRベースのAIモデルにおける公平性を緩和する)は、様々な手法を用いて取り組まれてきたが、タスクやモデルに依存しない手法は顕著に稀である。
本研究では,実データと合成されたERHデータを生成するパイプラインを新たに提示し,実データと組み合わせることで,下流タスクにおける公平性(エンドユーザが定義する)の懸念を軽減することを目的とした。
下流タスクと2つの異なるEHRデータセットにまたがるパイプラインの有効性を実証する。
提案したパイプラインは、ダウンストリームモデルの設計を変更するような、健康なAIアプリケーションにおける公平性に対処するための、既存のツールボックスに広く適用可能な補完ツールを追加することができる。
プロジェクトのコードベースはhttps://github.com/healthylaife/FairSynthで公開されています。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Bt-GAN: Generating Fair Synthetic Healthdata via Bias-transforming Generative Adversarial Networks [3.3903891679981593]
本稿では,医療領域に特化して設計されたGANベースの合成データジェネレータであるBias-transforming Generative Adversarial Networks (Bt-GAN)について述べる。
以上の結果から,Bt-GANはSOTA精度を向上し,公平性とバイアスの最小化を図った。
論文 参考訳(メタデータ) (2024-04-21T12:16:38Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - HealthGAT: Node Classifications in Electronic Health Records using Graph Attention Networks [2.2026317523029193]
HealthGATは、EHRから埋め込みを生成するグラフアテンションネットワークフレームワークである。
本モデルでは,医療コードへの埋め込みを反復的に洗練し,EHRデータ解析の改善を実現している。
本モデルでは,ノード分類や,可読度予測や診断分類などの下流タスクにおいて,優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-26T22:17:01Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - A review of Generative Adversarial Networks for Electronic Health
Records: applications, evaluation measures and data sources [8.319639237899155]
Generative Adversarial Networks (GANs) は、基礎となるデータ分布を学習することで、合成EHRデータを生成する大きな可能性を示している。
本研究は,GANs for EHRの様々な応用における主要な展開を概観することを目的としており,提案手法の概要を提供する。
我々は、EHR開発におけるGANの課題について議論し、推奨プラクティスを提案することで締めくくります。
論文 参考訳(メタデータ) (2022-03-14T11:56:47Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Deep-HR: Fast Heart Rate Estimation from Face Video Under Realistic
Conditions [62.68522031911656]
本稿では、複雑なタスクからのHR推定を単純化し、非常に相関した表現からHRへ学習することで、Deep Neural Network(DNN)の利点を享受する、シンプルで効率的なアプローチを提案する。
より正確で高品質なビデオでは、FEの出力を改善するために、2つのディープエンコーダデコーダネットワークが訓練されている。
HR-DおよびMAHNOBデータセットによる実験結果から,本手法がリアルタイム手法として動作し,最先端の手法よりも平均HRを推定できることが確認された。
論文 参考訳(メタデータ) (2020-02-12T07:00:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。