論文の概要: RareGraph-Synth: Knowledge-Guided Diffusion Models for Generating Privacy-Preserving Synthetic Patient Trajectories in Ultra-Rare Diseases
- arxiv url: http://arxiv.org/abs/2510.06267v1
- Date: Mon, 06 Oct 2025 03:59:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.080603
- Title: RareGraph-Synth: Knowledge-Guided Diffusion Models for Generating Privacy-Preserving Synthetic Patient Trajectories in Ultra-Rare Diseases
- Title(参考訳): RareGraph-Synth:Ultra-Rare病におけるプライバシ保存患者軌道生成のための知識誘導拡散モデル
- Authors: Khartik Uppalapati, Shakeel Abdulkareem, Bora Yimenicioglu,
- Abstract要約: 超希少疾患の軌跡を生成する知識誘導型連続拡散フレームワークを提案する。
RareGraph-Synthは5つの公開リソースを約8Mの型付きエッジからなる異種知識グラフに統合する。
保護された健康情報を含まない、ラボコード、薬物コード、悪臭の三重奏のタイムスタンプが生成される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose RareGraph-Synth, a knowledge-guided, continuous-time diffusion framework that generates realistic yet privacy-preserving synthetic electronic-health-record (EHR) trajectories for ultra-rare diseases. RareGraph-Synth unifies five public resources: Orphanet/Orphadata, the Human Phenotype Ontology (HPO), the GARD rare-disease KG, PrimeKG, and the FDA Adverse Event Reporting System (FAERS) into a heterogeneous knowledge graph comprising approximately 8 M typed edges. Meta-path scores extracted from this 8-million-edge KG modulate the per-token noise schedule in the forward stochastic differential equation, steering generation toward biologically plausible lab-medication-adverse-event co-occurrences while retaining score-based diffusion model stability. The reverse denoiser then produces timestamped sequences of lab-code, medication-code, and adverse-event-flag triples that contain no protected health information. On simulated ultra-rare-disease cohorts, RareGraph-Synth lowers categorical Maximum Mean Discrepancy by 40 percent relative to an unguided diffusion baseline and by greater than 60 percent versus GAN counterparts, without sacrificing downstream predictive utility. A black-box membership-inference evaluation using the DOMIAS attacker yields AUROC approximately 0.53, well below the 0.55 safe-release threshold and substantially better than the approximately 0.61 plus or minus 0.03 observed for non-KG baselines, demonstrating strong resistance to re-identification. These results suggest that integrating biomedical knowledge graphs directly into diffusion noise schedules can simultaneously enhance fidelity and privacy, enabling safer data sharing for rare-disease research.
- Abstract(参考訳): 超希少疾患に対する現実的かつプライバシ保護型合成電子健康記録(EHR)トラジェクトリを生成するための知識誘導型連続拡散フレームワークであるRareGraph-Synthを提案する。
RareGraph-Synthは、Orphanet/Orphadata, the Human Phenotype Ontology (HPO), the GARD rare-disease KG, PrimeKG, and the FDA Adverse Event Reporting System (FAERS)の5つの公共リソースを、約8Mの型付きエッジからなる異種知識グラフに統合している。
この八百万縁KGから抽出したメタパススコアは、前方確率微分方程式におけるトーケン毎のノイズスケジュールを変調し、スコアベース拡散モデルの安定性を維持しつつ、生物学的に妥当なラボ-メディケーション-逆イベント共起系へのステアリング生成を行う。
その後、リバース・デノイザーは、保護された健康情報を含まない、ラボコード、薬物コード、悪臭の三重奏のタイムスタンプを発生させる。
シミュレーションされた超希薄コホートでは、RareGraph-Synthは、下流予測ユーティリティを犠牲にすることなく、非誘導拡散ベースラインに対してカテゴリの最大平均値の差を40%下げ、GANに対して60%以上下げる。
DOMIASアタッカーを用いたブラックボックスメンバーシップ推論評価では、AUROCは約0.53で、0.55セーフリリース閾値よりかなり低く、非KGベースラインで観測された約0.61プラスまたはマイナス0.03よりも大幅に優れ、再識別に対する強い抵抗を示す。
これらの結果は,生物医学的知識グラフを拡散ノイズスケジュールに直接統合することで,忠実度とプライバシを同時に向上し,希少な研究のための安全なデータ共有を可能にすることを示唆している。
関連論文リスト
- Adapting HFMCA to Graph Data: Self-Supervised Learning for Generalizable fMRI Representations [57.054499278843856]
機能的磁気共鳴画像(fMRI)解析は、データセットのサイズが限られ、研究間でのドメインの変動が原因で大きな課題に直面している。
コンピュータビジョンにインスパイアされた従来の自己教師付き学習手法は、正と負のサンプルペアに依存することが多い。
本稿では,最近開発された階層関数最大相関アルゴリズム(HFMCA)をグラフ構造fMRIデータに適用することを提案する。
論文 参考訳(メタデータ) (2025-10-05T12:35:01Z) - Synthetic Survival Data Generation for Heart Failure Prognosis Using Deep Generative Models [0.0]
心臓不全(HF)の研究は、プライバシー規制と制度上の障壁により、大きな共有可能なデータセットへのアクセスが制限されていることで制限されている。
12,552人のユニークな患者からなる施設データから合成HFデータセットを生成した。
ディープラーニングに基づく合成データ生成は、研究アプリケーションに適した高忠実でプライバシー保護のHFデータセットを生成することができる。
論文 参考訳(メタデータ) (2025-09-04T14:17:58Z) - Detection of Autonomic Dysreflexia in Individuals With Spinal Cord Injury Using Multimodal Wearable Sensors [2.208475400165877]
自律神経障害 (AD) は、脊髄損傷者(SCI)の突然の血圧急上昇を特徴とする生命予後の1つである。
本研究では,マルチモーダルウェアラブルセンサを用いたAD検出のための非侵襲的,説明可能な機械学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-23T21:18:23Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - A Demographic-Conditioned Variational Autoencoder for fMRI Distribution Sampling and Removal of Confounds [49.34500499203579]
変動型オートエンコーダ(VAE)ベースのモデルであるDemoVAEを作成し、人口統計学から fMRI の特徴を推定する。
ユーザが供給する人口動態に基づいて,高品質な合成fMRIデータを生成する。
論文 参考訳(メタデータ) (2024-05-13T17:49:20Z) - Guided Discrete Diffusion for Electronic Health Record Generation [47.129056768385084]
EHRは、病気の進行予測、臨床試験設計、健康経済学と結果研究など、多くの計算医学の応用を可能にする中心的なデータソースである。
幅広いユーザビリティにもかかわらず、その繊細な性質はプライバシーと秘密の懸念を高め、潜在的なユースケースを制限する。
これらの課題に対処するために,人工的かつ現実的なEHRを合成するための生成モデルの利用について検討する。
論文 参考訳(メタデータ) (2024-04-18T16:50:46Z) - Fairness-Aware Data Augmentation for Cardiac MRI using Text-Conditioned Diffusion Models [1.6581402323174208]
本稿では,データセットに固有の不均衡を,合成データの生成によって緩和する手法を提案する。
我々は,患者メタデータと心臓の形状から合成したテキストを条件に,拡散確率モデルに基づく制御ネットを採用する。
本実験は,データセットの不均衡を緩和する手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2024-03-28T15:41:43Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。