論文の概要: ASCENDgpt: A Phenotype-Aware Transformer Model for Cardiovascular Risk Prediction from Electronic Health Records
- arxiv url: http://arxiv.org/abs/2509.04485v1
- Date: Sun, 31 Aug 2025 16:43:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.325488
- Title: ASCENDgpt: A Phenotype-Aware Transformer Model for Cardiovascular Risk Prediction from Electronic Health Records
- Title(参考訳): ASCENDgpt:電子カルテを用いた心血管リスク予測のためのフェノタイプ対応トランスフォーマーモデル
- Authors: Chris Sainsbury, Andreas Karwath,
- Abstract要約: ASCENDgptは経時的電子的健康記録から心血管性リスクを予測するためのトランスフォーマーモデルである。
本手法では,47,155個の生のICDコードを176個の臨床的に有意な表現型トークンにマッピングする新規な表現型トークン化方式を提案する。
この表現型マッピングは、10,442個のトークンの総語彙に寄与する。
- 参考スコア(独自算出の注目度): 0.04910937238451483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present ASCENDgpt, a transformer-based model specifically designed for cardiovascular risk prediction from longitudinal electronic health records (EHRs). Our approach introduces a novel phenotype-aware tokenization scheme that maps 47,155 raw ICD codes to 176 clinically meaningful phenotype tokens, achieving 99.6\% consolidation of diagnosis codes while preserving semantic information. This phenotype mapping contributes to a total vocabulary of 10,442 tokens - a 77.9\% reduction when compared with using raw ICD codes directly. We pretrain ASCENDgpt on sequences derived from 19402 unique individuals using a masked language modeling objective, then fine-tune for time-to-event prediction of five cardiovascular outcomes: myocardial infarction (MI), stroke, major adverse cardiovascular events (MACE), cardiovascular death, and all-cause mortality. Our model achieves excellent discrimination on the held-out test set with an average C-index of 0.816, demonstrating strong performance across all outcomes (MI: 0.792, stroke: 0.824, MACE: 0.800, cardiovascular death: 0.842, all-cause mortality: 0.824). The phenotype-based approach enables clinically interpretable predictions while maintaining computational efficiency. Our work demonstrates the effectiveness of domain-specific tokenization and pretraining for EHR-based risk prediction tasks.
- Abstract(参考訳): ASCENDgptは、経時的電子健康記録(EHRs)から心血管系リスク予測に特化して設計されたトランスフォーマーモデルである。
提案手法では,47,155個の生のICDコードを176個の臨床的に有意な表現型トークンにマッピングし,意味情報を保存しながら,99.6 %の診断コードの統合を実現する。
この表現型マッピングは、10,442個のトークンの総語彙に寄与する。
19402名から得られたASCENDgptを,マスク言語モデリングの目的を用いてプレトレーニングし,心筋梗塞(MI),脳卒中,重症心血管障害(MACE),心臓血管死,全死亡の5つの心血管結果の経時的予測に用いた。
平均C-インデックスは0.816であり,すべての結果(MI: 0.792, 脳卒中: 0.824, MACE: 0.800, 心血管死: 0.842, 全死亡例: 0.824)に対して高い評価が得られた。
表現型に基づくアプローチは、計算効率を維持しながら臨床的に解釈可能な予測を可能にする。
本研究は,EHRに基づくリスク予測タスクにおいて,ドメイン固有のトークン化と事前学習の有効性を示す。
関連論文リスト
- A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - CardioTabNet: A Novel Hybrid Transformer Model for Heart Disease Prediction using Tabular Medical Data [0.46581008529871043]
本研究は,1190の症例と11の特徴を有する心臓病予測のためのオープンソースデータセットを用いている。
10種類の機械学習モデルを用いて心疾患の予測を行った。
トップダウンストリームモデル(ハイパーチューニングされたエクストラトレー)の平均精度は94.1%、エリアアンダーカーブ(AUC)の平均精度は95.0%に達した。
論文 参考訳(メタデータ) (2025-03-22T06:17:08Z) - A Transformer-based survival model for prediction of all-cause mortality in heart failure patients: a multi-cohort study [5.831730826863567]
心不全患者の36カ月の死亡を予測できるトランスフォーマーベースのAIモデルであるTRiskを開発した。
英国では1,418例の心不全403,534例(40~90歳)について検討した。
論文 参考訳(メタデータ) (2025-03-16T01:53:50Z) - Leveraging Cardiovascular Simulations for In-Vivo Prediction of Cardiac Biomarkers [43.17768785084301]
我々は、新たに構築された心臓シミュレーションの大規模なデータセットに基づいて、無傷神経後部推定器を訓練する。
シミュレーションデータと実世界の測定値との整合性を改善するために,要素モデリング効果を取り入れた。
提案するフレームワークは,実世界のデータに対する予測能力を向上するために,インバイブなデータソースをさらに統合することができる。
論文 参考訳(メタデータ) (2024-12-23T13:05:17Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Integrating Deep Learning with Fundus and Optical Coherence Tomography for Cardiovascular Disease Prediction [47.7045293755736]
心血管疾患(CVD)のリスクのある患者の早期発見は、効果的な予防ケア、医療負担の軽減、患者の生活の質の向上に不可欠である。
本研究は、網膜光コヒーレンス断層撮影(OCT)と眼底写真との併用による、将来の心疾患の特定の可能性を示すものである。
そこで我々は,MCVAE(Multi- Channel Variational Autoencoder)に基づく新たなバイナリ分類ネットワークを提案し,患者の眼底画像とOCT画像の潜伏埋め込みを学習し,個人を将来CVDを発症する可能性のあるものとそうでないものとの2つのグループに分類する。
論文 参考訳(メタデータ) (2024-10-18T12:37:51Z) - Predicting risk of cardiovascular disease using retinal OCT imaging [40.71667870702634]
心臓血管疾患(CVD)が世界的に死因となっている。
光コヒーレンストモグラフィー(OCT)は早期のCVDリスク予測の潜在的なツールとして認識されている。
我々は,将来のCVD事象を予測するための追加撮像技術としてのOCTの可能性について検討した。
論文 参考訳(メタデータ) (2024-03-26T14:42:46Z) - Interpretable estimation of the risk of heart failure hospitalization
from a 30-second electrocardiogram [2.167398752829277]
本研究は,30秒の単心電図信号で心不全の入院を推定できることを示唆する。
機械学習アプローチを使用することで、予測能力が向上するだけでなく、臨床的に意味のある解釈も得られる。
論文 参考訳(メタデータ) (2022-11-02T01:53:07Z) - BIO-CXRNET: A Robust Multimodal Stacking Machine Learning Technique for
Mortality Risk Prediction of COVID-19 Patients using Chest X-Ray Images and
Clinical Data [0.0]
本研究は、イタリアで入院した930人の新型コロナウイルス患者のリスクを予測するために、25のバイオマーカーとCXR画像を用いている。
提案手法は精度、感度、F1スコアをそれぞれ89.03%、90.44%、89.03%とした。
ノモグラムに基づく採点法では、F1スコア92.88 %の高リスク患者の死亡確率を予測することができた。
論文 参考訳(メタデータ) (2022-06-15T15:23:43Z) - Prediction of the onset of cardiovascular diseases from electronic
health records using multi-task gated recurrent units [51.14334174570822]
本稿では,電子カルテから心血管イベントを予測するための注意機構を備えたマルチタスク・リカレントニューラルネットワークを提案する。
提案手法は、NHS Foundation Trustの5年間のデータを用いて、標準的な臨床リスク予測器(QRISK)と機械学習の代替手段と比較される。
論文 参考訳(メタデータ) (2020-07-16T17:43:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。