論文の概要: Generation of Synthetic Electronic Health Records Using a Federated GAN
- arxiv url: http://arxiv.org/abs/2109.02543v1
- Date: Mon, 6 Sep 2021 15:29:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-07 19:48:33.259614
- Title: Generation of Synthetic Electronic Health Records Using a Federated GAN
- Title(参考訳): フェデレートGANを用いた合成電子健康記録の作成
- Authors: John Weldon, Tomas Ward, Eoin Brophy
- Abstract要約: 実世界の電子健康記録(EHR)に基づいてGAN(Generative Adversarial Network)を訓練した。
その後、使用制限を回避するために「フェイク」患者のデータセットを作成するために使用された。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sensitive medical data is often subject to strict usage constraints. In this
paper, we trained a generative adversarial network (GAN) on real-world
electronic health records (EHR). It was then used to create a data-set of
"fake" patients through synthetic data generation (SDG) to circumvent usage
constraints. This real-world data was tabular, binary, intensive care unit
(ICU) patient diagnosis data. The entire data-set was split into separate data
silos to mimic real-world scenarios where multiple ICU units across different
hospitals may have similarly structured data-sets within their own
organisations but do not have access to each other's data-sets. We implemented
federated learning (FL) to train separate GANs locally at each organisation,
using their unique data silo and then combining the GANs into a single central
GAN, without any siloed data ever being exposed. This global, central GAN was
then used to generate the synthetic patients data-set. We performed an
evaluation of these synthetic patients with statistical measures and through a
structured review by a group of medical professionals. It was shown that there
was no significant reduction in the quality of the synthetic EHR when we moved
between training a single central model and training on separate data silos
with individual models before combining them into a central model. This was
true for both the statistical evaluation (Root Mean Square Error (RMSE) of
0.0154 for single-source vs. RMSE of 0.0169 for dual-source federated) and also
for the medical professionals' evaluation (no quality difference between EHR
generated from a single source and EHR generated from multiple sources).
- Abstract(参考訳): 敏感な医療データは、しばしば厳格な使用制限を受ける。
本稿では,現実の電子健康記録(EHR)に基づいてGAN(Generative Adversarial Network)を訓練した。
その後、使用制限を回避するために合成データ生成(SDG)を通じて「フェイク」患者のデータセットを作成するために使用された。
この実世界のデータは、表型、バイナリ、集中治療ユニット(ICU)の患者診断データであった。
データセット全体を別々のデータサイロに分割して、異なる病院にまたがる複数のICUユニットが、組織内でも同様に構造化されたデータセットを持つが、互いにデータセットにアクセスできない、現実のシナリオを模倣した。
私たちは、各組織で独自のデータサイロを使用して、各組織で個別のGANをトレーニングし、単一の中心的なGANにGANを結合するために、FL(Federated Learning)を実装しました。
このグローバルな中心的なGANは、合成患者のデータセットを生成するために使用される。
統計学的尺度を用いてこれらの合成患者の評価を行い, 医療専門家グループによる構造化レビューを行った。
その結果,1つの中心モデルのトレーニングと,個別のモデルと個別のデータサイロのトレーニングの間を移動し,それらを中心モデルに組み合わせた場合,合成EHRの品質は著しく低下しないことがわかった。
これは、統計学的評価(単一ソースで0.0154、二重ソースで0.0169、RMSEで0.0154)と、医療専門家による評価(単一ソースで生成されたEHRと複数のソースで生成されたEHRとの品質差はない)の両方に当てはまる。
関連論文リスト
- Federated Impression for Learning with Distributed Heterogeneous Data [19.50235109938016]
フェデレートラーニング(FL)は、データを共有することなく、クライアント間で分散データセットから学習できるパラダイムを提供する。
FLでは、データ収集プロトコルや患者人口の多様さにより、異なる保健所のデータに準最適収束が一般的である。
我々は,グローバル情報を表す合成データをフェデレーションとして復元することで,破滅的な忘れを緩和するFedImpresを提案する。
論文 参考訳(メタデータ) (2024-09-11T15:37:52Z) - Distributed Traffic Synthesis and Classification in Edge Networks: A
Federated Self-supervised Learning Approach [83.2160310392168]
本稿では,多数の異種データセット上での自動トラフィック解析と合成を支援するFS-GANを提案する。
FS-GANは複数の分散ジェネレーティブ・アドバイサル・ネットワーク(GAN)から構成される
FS-GANは未知のサービスのデータを分類し、未知のタイプのトラフィック分布をキャプチャする合成サンプルを作成する。
論文 参考訳(メタデータ) (2023-02-01T03:23:11Z) - Evaluation of the Synthetic Electronic Health Records [3.255030588361125]
本研究は、合成データセットのサンプルワイズ評価のための類似性と特異性という2つの指標を概説する。
本研究は,Cystic Fibrosis (CF) 患者の電子的健康記録を合成するために,いくつかの最先端の遺伝子モデルを用いて提案された概念を実証する。
論文 参考訳(メタデータ) (2022-10-16T22:46:08Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Medical data wrangling with sequential variational autoencoders [5.9207487081080705]
本稿では,逐次変分オートエンコーダ(vaes)を用いた異種データ型とバースト欠落データを用いた医療データ記録のモデル化を提案する。
GP-VAEモデルより計算複雑性が低く,両指標を用いた場合,Shi-VAEが最高の性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-03-12T10:59:26Z) - A Tree-based Federated Learning Approach for Personalized Treatment
Effect Estimation from Heterogeneous Data Sources [5.049057348282933]
フェデレーション学習は、分散ヘルスデータネットワークから機密データを分析するための魅力的なフレームワークである。
本研究は, 治療効果評価装置を効率よく, 解釈可能なツリーベースアンサンブルを開発した。
論文 参考訳(メタデータ) (2021-03-10T18:51:30Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - FedH2L: Federated Learning with Model and Statistical Heterogeneity [75.61234545520611]
フェデレートラーニング(FL)は、分散参加者が個々のデータのプライバシを犠牲にすることなく、強力なグローバルモデルを集合的に学習することを可能にする。
我々はFedH2Lを導入し、これはモデルアーキテクチャに非依存であり、参加者間で異なるデータ分散に対して堅牢である。
パラメータや勾配を共有するアプローチとは対照的に、FedH2Lは相互蒸留に依存し、参加者間で共有シードセットの後方のみを分散的に交換する。
論文 参考訳(メタデータ) (2021-01-27T10:10:18Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Generation of Differentially Private Heterogeneous Electronic Health
Records [9.926231893220061]
本稿では, 合成異種EHRの生成にジェネレーティブ・アドバーサリアル・ネットワークを用いて検討する。
本稿では,DP 合成 EHR データセットを作成するために,差分プライバシ(DP)保存最適化の適用について検討する。
論文 参考訳(メタデータ) (2020-06-05T13:21:46Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。