論文の概要: PRIME-CVD: A Parametrically Rendered Informatics Medical Environment for Education in Cardiovascular Risk Modelling
- arxiv url: http://arxiv.org/abs/2603.19299v1
- Date: Wed, 11 Mar 2026 05:57:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 02:36:12.866787
- Title: PRIME-CVD: A Parametrically Rendered Informatics Medical Environment for Education in Cardiovascular Risk Modelling
- Title(参考訳): PRIME-CVD : 循環器疾患モデルにおける教育のためのパラメトリック・レンダード・インフォマティクス・メディカル環境
- Authors: Nicholas I-Hsien Kuo, Marzia Hoque Tania, Blanca Gallego, Louisa Jorm,
- Abstract要約: PRIME-CVDは医学教育用に明確に設計された医療環境である。
心血管疾患の一次予防を行う成人5万人のコホートを表す2つのオープンアクセス合成データ資産から構成される。
Data Asset 1は、探索分析、成層化、生存モデリングに適したクリーンで分析可能なコホートを提供する一方、Data Asset 2は同じコホートを、現実的な構造的および語彙的不均一性を持つリレーショナルなEMRスタイルのデータベースに再構成する。
全ての個人やイベントがデノボで生成されるため、PRIME-CVDは無視可能な開示リスクを確保しつつ、現実的なサブグループ不均衡とリスク勾配を保っている。
- 参考スコア(独自算出の注目度): 0.93496537653413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, progress in medical informatics and machine learning has been accelerated by the availability of openly accessible benchmark datasets. However, patient-level electronic medical record (EMR) data are rarely available for teaching or methodological development due to privacy, governance, and re-identification risks. This has limited reproducibility, transparency, and hands-on training in cardiovascular risk modelling. Here we introduce PRIME-CVD, a parametrically rendered informatics medical environment designed explicitly for medical education. PRIME-CVD comprises two openly accessible synthetic data assets representing a cohort of 50,000 adults undergoing primary prevention for cardiovascular disease. The datasets are generated entirely from a user-specified causal directed acyclic graph parameterised using publicly available Australian population statistics and published epidemiologic effect estimates, rather than from patient-level EMR data or trained generative models. Data Asset 1 provides a clean, analysis-ready cohort suitable for exploratory analysis, stratification, and survival modelling, while Data Asset 2 restructures the same cohort into a relational, EMR-style database with realistic structural and lexical heterogeneity. Together, these assets enable instruction in data cleaning, harmonisation, causal reasoning, and policy-relevant risk modelling without exposing sensitive information. Because all individuals and events are generated de novo, PRIME-CVD preserves realistic subgroup imbalance and risk gradients while ensuring negligible disclosure risk. PRIME-CVD is released under a Creative Commons Attribution 4.0 licence to support reproducible research and scalable medical education.
- Abstract(参考訳): 近年,オープンアクセス型ベンチマークデータセットの利用により,医療情報学や機械学習の進歩が加速している。
しかしながら、患者レベルの電子カルテ(EMR)データは、プライバシ、ガバナンス、再識別リスクによる教育や方法論開発にはほとんど利用できない。
これは、循環器系のリスクモデリングにおける再現性、透明性、ハンズオントレーニングに制限がある。
本稿では,医学教育に特化して設計されたパラメトリックな情報医療環境であるPRIME-CVDを紹介する。
PRIME-CVDは、心血管疾患の一次予防を行う成人5万人のコホートを表す2つのオープンアクセス合成データ資産からなる。
データセットは、患者レベルのEMRデータや訓練された生成モデルではなく、一般に利用可能なオーストラリアの人口統計を用いてパラメータ化され、疫学的効果の推定結果が公表されたユーザ特定因果非循環グラフから完全に生成される。
Data Asset 1は、探索分析、成層化、生存モデリングに適したクリーンで分析可能なコホートを提供する一方、Data Asset 2は同じコホートを、現実的な構造的および語彙的不均一性を持つリレーショナルなEMRスタイルのデータベースに再構成する。
これらの資産は、機密情報を暴露することなく、データのクリーニング、調和、因果推論、政策関連リスクモデリングの指導を可能にする。
全ての個人やイベントがデノボで生成されるため、PRIME-CVDは無視可能な開示リスクを確保しつつ、現実的なサブグループ不均衡とリスク勾配を保っている。
PRIME-CVDはCreative Commons Attribution 4.0ライセンスの下でリリースされ、再現可能な研究とスケーラブルな医療教育をサポートする。
関連論文リスト
- Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - FedCVD: The First Real-World Federated Learning Benchmark on Cardiovascular Disease Data [52.55123685248105]
心臓血管疾患(CVD)は、現在世界でも主要な死因であり、早期診断と治療の要点を浮き彫りにしている。
機械学習(ML)手法はCVDの早期診断に役立つが、その性能は高品質なデータへのアクセスに依存している。
本稿では、FedCVDという心臓血管疾患検出のための、世界初の実世界のFLベンチマークを示す。
論文 参考訳(メタデータ) (2024-10-28T02:24:01Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Integrated Convolutional and Recurrent Neural Networks for Health Risk
Prediction using Patient Journey Data with Many Missing Values [9.418011774179794]
本稿では,統合畳み込みニューラルネットワークとリカレントニューラルネットワークを用いたEMH患者旅行データモデリングのためのエンドツーエンドアプローチを提案する。
本モデルでは,各患者旅行における長期的・短期的時間的パターンを抽出し,インパルスデータ生成を伴わずに,高レベルのEHRデータの欠落を効果的に処理することができる。
論文 参考訳(メタデータ) (2022-11-11T07:36:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。