論文の概要: Conditional Generation of Medical Time Series for Extrapolation to
Underrepresented Populations
- arxiv url: http://arxiv.org/abs/2201.08186v1
- Date: Thu, 20 Jan 2022 14:04:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-21 14:33:04.420259
- Title: Conditional Generation of Medical Time Series for Extrapolation to
Underrepresented Populations
- Title(参考訳): 人口不足に対する外挿用医療時系列の条件付き生成
- Authors: Simon Bing, Andrea Dittadi, Stefan Bauer, Patrick Schwab
- Abstract要約: HealthGenは、現在の最先端技術よりも実際の患者EHRに忠実な合成コホートを生成する。
実際のデータセットを条件付きで生成したコホートで拡張することで、患者の人口不足がモデルの一般性を大幅に向上させることができる。
- 参考スコア(独自算出の注目度): 27.49371449726921
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread adoption of electronic health records (EHRs) and subsequent
increased availability of longitudinal healthcare data has led to significant
advances in our understanding of health and disease with direct and immediate
impact on the development of new diagnostics and therapeutic treatment options.
However, access to EHRs is often restricted due to their perceived sensitive
nature and associated legal concerns, and the cohorts therein typically are
those seen at a specific hospital or network of hospitals and therefore not
representative of the wider population of patients. Here, we present HealthGen,
a new approach for the conditional generation of synthetic EHRs that maintains
an accurate representation of real patient characteristics, temporal
information and missingness patterns. We demonstrate experimentally that
HealthGen generates synthetic cohorts that are significantly more faithful to
real patient EHRs than the current state-of-the-art, and that augmenting real
data sets with conditionally generated cohorts of underrepresented
subpopulations of patients can significantly enhance the generalisability of
models derived from these data sets to different patient populations. Synthetic
conditionally generated EHRs could help increase the accessibility of
longitudinal healthcare data sets and improve the generalisability of
inferences made from these data sets to underrepresented populations.
- Abstract(参考訳): 電子健康記録(EHR)の普及と,その後の縦断的医療データの増加は,新たな診断・治療オプションの開発に直接的かつ即時的に影響を及ぼすことなく,我々の健康・疾患理解に大きな進展をもたらした。
しかしながら、EHRへのアクセスは、知覚的な性質と関連する法的懸念のために制限されることが多く、そのコホートは、典型的には特定の病院や病院のネットワークで見られるものであるため、より広範な患者を代表していない。
本稿では, 患者特性, 時間的情報, 欠如パターンの正確な表現を維持する合成eersの条件生成のための新しい手法であるhealthgenを提案する。
そこで本研究では,現況よりも実患者ehlsに有意に忠実な合成コホートを生産し,低発現のサブポピュレーションの条件付きコホートで実データ集合を増強することで,これらのデータから導出したモデルを異なる患者集団に一般化できることを実験的に示す。
合成条件付きEHRは、縦断的な医療データセットのアクセシビリティを高め、これらのデータセットから表現されていない人口への推論の一般性を向上させる。
関連論文リスト
- Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - CEHR-GPT: Generating Electronic Health Records with Chronological Patient Timelines [14.386260536090628]
我々は合成データ生成に焦点をあて、特定の患者表現を用いてGPTモデルを訓練する能力を実証する。
これにより、観察医療成果パートナーシップ(OMOP)データフォーマットにシームレスに変換できる患者シーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-02-06T20:58:36Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Integrated Convolutional and Recurrent Neural Networks for Health Risk
Prediction using Patient Journey Data with Many Missing Values [9.418011774179794]
本稿では,統合畳み込みニューラルネットワークとリカレントニューラルネットワークを用いたEMH患者旅行データモデリングのためのエンドツーエンドアプローチを提案する。
本モデルでは,各患者旅行における長期的・短期的時間的パターンを抽出し,インパルスデータ生成を伴わずに,高レベルのEHRデータの欠落を効果的に処理することができる。
論文 参考訳(メタデータ) (2022-11-11T07:36:18Z) - Cumulative Stay-time Representation for Electronic Health Records in
Medical Event Time Prediction [8.261597797345342]
累積滞留時間表現(CTR)と呼ばれる新しいEMHデータ表現を提案する。
CTRはそのような累積的な健康状態を直接モデル化する。
我々は、ターゲットデータに適合する柔軟性を持つニューラルネットワークに基づくトレーニング可能なCTRの構築を導出する。
論文 参考訳(メタデータ) (2022-04-28T12:34:41Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。