論文の概要: Privacy-Preserving Generative Modeling and Clinical Validation of Longitudinal Health Records for Chronic Disease
- arxiv url: http://arxiv.org/abs/2512.00434v1
- Date: Sat, 29 Nov 2025 10:16:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.240733
- Title: Privacy-Preserving Generative Modeling and Clinical Validation of Longitudinal Health Records for Chronic Disease
- Title(参考訳): 慢性疾患におけるプライバシ保存ジェネレーションモデルと経時的健康記録の臨床的検証
- Authors: Benjamin D. Ballyk, Ankit Gupta, Sujay Konda, Kavitha Subramanian, Chris Landon, Ahmed Ammar Naseer, Georg Maierhofer, Sumanth Swaminathan, Vasudevan Venkateshwaran,
- Abstract要約: 我々は,現在最先端の時系列生成モデルを強化し,定量的なプライバシ保護を取り入れつつ,経時的臨床データをよりよく処理する。
我々の非プライベートモデル(Augmented TimeGAN)は、いくつかのデータセットにおける統計メトリクスのトランスフォーマーおよびフローベースモデルよりも優れています。
我々のプライベートモデル(DP-TimeGAN)は、CKDデータセットにおける平均信頼度0.778を維持し、プライバシユーティリティフロンティアにおける既存の最先端モデルよりも優れています。
- 参考スコア(独自算出の注目度): 1.334430331852034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data privacy is a critical challenge in modern medical workflows as the adoption of electronic patient records has grown rapidly. Stringent data protection regulations limit access to clinical records for training and integrating machine learning models that have shown promise in improving diagnostic accuracy and personalized care outcomes. Synthetic data offers a promising alternative; however, current generative models either struggle with time-series data or lack formal privacy guaranties. In this paper, we enhance a state-of-the-art time-series generative model to better handle longitudinal clinical data while incorporating quantifiable privacy safeguards. Using real data from chronic kidney disease and ICU patients, we evaluate our method through statistical tests, a Train-on-Synthetic-Test-on-Real (TSTR) setup, and expert clinical review. Our non-private model (Augmented TimeGAN) outperforms transformer- and flow-based models on statistical metrics in several datasets, while our private model (DP-TimeGAN) maintains a mean authenticity of 0.778 on the CKD dataset, outperforming existing state-of-the-art models on the privacy-utility frontier. Both models achieve performance comparable to real data in clinician evaluations, providing robust input data necessary for developing models for complex chronic conditions without compromising data privacy.
- Abstract(参考訳): データプライバシは、電子的な患者の記録の採用が急速に増加しているため、現代の医療ワークフローにおいて重要な課題である。
厳格なデータ保護規則は、診断精度とパーソナライズされたケア結果を改善することを約束している機械学習モデルのトレーニングと統合のための臨床記録へのアクセスを制限する。
合成データは有望な代替手段を提供するが、現在の生成モデルは時系列データと苦労するか、正式なプライバシー保証が欠如している。
本稿では,現在最先端の時系列生成モデルを拡張して,定量的プライバシー保護を取り入れつつ,経時的臨床データをよりよく処理する。
慢性腎疾患およびICU患者の実データを用いて,統計検査,Train-on-Synthetic-Test-on-Real(TSTR)設定,臨床評価を行った。
我々の非プライベートモデル(Augmented TimeGAN)は、いくつかのデータセットにおける統計メトリクスのトランスフォーマーとフローベースのモデルよりも優れていますが、私たちのプライベートモデル(DP-TimeGAN)はCKDデータセットにおける平均信頼度0.778を維持しており、プライバシユーティリティフロンティアにおける既存の最先端モデルよりも優れています。
どちらのモデルも臨床評価において実際のデータに匹敵するパフォーマンスを達成し、データのプライバシーを損なうことなく複雑な慢性状態のモデルを開発するために必要な堅牢な入力データを提供する。
関連論文リスト
- CURENet: Combining Unified Representations for Efficient Chronic Disease Prediction [24.569877750738286]
CURENetは、構造化されていない臨床ノート、検査結果、患者の時系列データを統合するマルチモーダルモデルである。
CURENetは、さまざまな臨床データ間の複雑な相互作用を捉え、慢性疾患のより信頼性の高い予測モデルを作成することができる。
論文 参考訳(メタデータ) (2025-11-14T15:52:22Z) - Controllable Synthetic Clinical Note Generation with Privacy Guarantees [7.1366477372157995]
本稿では、PHI(Personal Health Information)を含む「クローン」データセットに対する新しい手法を提案する。
我々のアプローチは、クローン化されたデータセットが患者のプライバシを損なうことなく、元のデータの本質的な特性と有用性を保っていることを保証します。
クローン化されたデータセットでトレーニングされた機械学習モデルの性能を評価するために,ユーティリティテストを実施している。
論文 参考訳(メタデータ) (2024-09-12T07:38:34Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Protect and Extend -- Using GANs for Synthetic Data Generation of
Time-Series Medical Records [1.9749268648715583]
本研究は、認知症患者の時系列合成医療記録を生成するために、現在最先端のGANベースの合成データ生成モデルと比較する。
本実験は,プライバシ保護に関する他のモデルよりも,プライバシ保護GAN(PPGAN)モデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-02-21T10:24:34Z) - IGNITE: Individualized GeNeration of Imputations in Time-series Electronic health records [6.630372114304835]
本研究では、患者動態を学習し、個人の人口動態の特徴や治療に合わせたパーソナライズされた値を生成する新しいディープラーニングモデルを提案する。
提案モデルであるIGNITEは,2段階の注意を付加した条件付き2変分オートエンコーダを用いて,個人に対して欠落した値を生成する。
IGNITEは,データ再構成の欠如やタスク予測において,最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-09T07:57:21Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - Hide-and-Seek Privacy Challenge [88.49671206936259]
NeurIPS 2020 Hide-and-Seek Privacy Challengeは、両方の問題を解決するための新しい2トラックの競争だ。
我々の頭から頭までのフォーマットでは、新しい高品質な集中ケア時系列データセットを用いて、合成データ生成トラック(「ヒッシャー」)と患者再識別トラック(「シーカー」)の参加者が直接対決する。
論文 参考訳(メタデータ) (2020-07-23T15:50:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。