論文の概要: BiPETE: A Bi-Positional Embedding Transformer Encoder for Risk Assessment of Alcohol and Substance Use Disorder with Electronic Health Records
- arxiv url: http://arxiv.org/abs/2511.04998v1
- Date: Fri, 07 Nov 2025 06:01:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.686489
- Title: BiPETE: A Bi-Positional Embedding Transformer Encoder for Risk Assessment of Alcohol and Substance Use Disorder with Electronic Health Records
- Title(参考訳): BiPETE : 電子カルテを用いたアルコール・物質使用障害リスク評価用バイポーション埋め込みトランスフォーマーエンコーダ
- Authors: Daniel S. Lee, Mayra S. Haedo-Cruz, Chen Jiang, Oshin Miranda, LiRong Wang,
- Abstract要約: 単相予測のためのBi-Positional Embedding Transformer(BiPETE)を提案する。
BiPETEは、精神保健コホート・うつ病と外傷後ストレス障害(PTSD)のEHRデータに基づいてトレーニングされ、アルコールと物質使用障害のリスクを予測する。
- 参考スコア(独自算出の注目度): 3.305393384521011
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transformer-based deep learning models have shown promise for disease risk prediction using electronic health records(EHRs), but modeling temporal dependencies remains a key challenge due to irregular visit intervals and lack of uniform structure. We propose a Bi-Positional Embedding Transformer Encoder or BiPETE for single-disease prediction, which integrates rotary positional embeddings to encode relative visit timing and sinusoidal embeddings to preserve visit order. Without relying on large-scale pretraining, BiPETE is trained on EHR data from two mental health cohorts-depressive disorder and post-traumatic stress disorder (PTSD)-to predict the risk of alcohol and substance use disorders (ASUD). BiPETE outperforms baseline models, improving the area under the precision-recall curve (AUPRC) by 34% and 50% in the depression and PTSD cohorts, respectively. An ablation study further confirms the effectiveness of the dual positional encoding strategy. We apply the Integrated Gradients method to interpret model predictions, identifying key clinical features associated with ASUD risk and protection, such as abnormal inflammatory, hematologic, and metabolic markers, as well as specific medications and comorbidities. Overall, these key clinical features identified by the attribution methods contribute to a deeper understanding of the risk assessment process and offer valuable clues for mitigating potential risks. In summary, our study presents a practical and interpretable framework for disease risk prediction using EHR data, which can achieve strong performance.
- Abstract(参考訳): トランスフォーマーに基づくディープラーニングモデルは、電子健康記録(EHR)を用いた病気のリスク予測を約束しているが、不規則な訪問間隔と均一な構造が欠如しているため、時間的依存関係のモデリングは重要な課題である。
回転位置埋め込みを統合して相対的な訪問タイミングと正弦波埋め込みを符号化し、訪問順序を保ちながら、単相予測のためのバイポジショナル埋め込み変換器(BiPETE)を提案する。
大規模プレトレーニングに頼らず、BiPETEは精神保健コホート・うつ病と外傷後ストレス障害(PTSD)のEHRデータに基づいて、アルコールと物質使用障害(ASUD)のリスクを予測する訓練を行っている。
BiPETEはベースラインモデルより優れ、精度・リコール曲線(AUPRC)の下での面積を、うつ病とPTSDコホートでそれぞれ34%、50%改善する。
Ablation study has confirmed the effect of the dual positional encoding strategy。
本手法をモデル予測の解釈に適用し, 異常炎症, 血液学的, 代謝マーカーなどのASUDのリスクと保護に関連する重要な臨床特徴を同定し, 特定の薬剤, 相乗効果について検討した。
全体として、帰属法によって同定されるこれらの重要な臨床特徴は、リスク評価プロセスのより深い理解に寄与し、潜在的なリスクを緩和するための貴重な手がかりを提供する。
本研究は,EHRデータを用いた疾患リスク予測のための実践的で解釈可能なフレームワークを提案する。
関連論文リスト
- Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - HypUC: Hyperfine Uncertainty Calibration with Gradient-boosted
Corrections for Reliable Regression on Imbalanced Electrocardiograms [3.482894964998886]
本稿では,医療時系列における不均衡確率回帰の枠組みであるHypUCを提案する。
HypUCは数百万の患者から収集された、多様で現実世界のECGデータセットで評価されている。
論文 参考訳(メタデータ) (2023-11-23T06:17:31Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Tree-Guided Rare Feature Selection and Logic Aggregation with Electronic
Health Records Data [7.422597776308963]
希少な二項特徴を持つ大規模回帰のための木誘導的特徴選択と論理集約手法を提案する。
EHRデータを用いた自殺リスクスタディでは、我々のアプローチは、以前のメンタルヘルス診断を選択して集約することができる。
論文 参考訳(メタデータ) (2022-06-18T03:52:43Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Bidirectional Representation Learning from Transformers using Multimodal
Electronic Health Record Data to Predict Depression [11.1492931066686]
うつ病の予測のために,ERHシーケンス上で双方向の表現学習を行うための時間的深層学習モデルを提案する。
このモデルでは, 曲線(PRAUC)下において, 最良ベースラインモデルと比較して, 抑うつ予測において0.70から0.76まで, 精度・リコール面積の最大値が得られた。
論文 参考訳(メタデータ) (2020-09-26T17:56:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。