論文の概要: Serialized EHR make for good text representations
- arxiv url: http://arxiv.org/abs/2510.13843v1
- Date: Sat, 11 Oct 2025 17:16:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.468744
- Title: Serialized EHR make for good text representations
- Title(参考訳): テキスト表現のためのシリアライズEHRの作成
- Authors: Zhirong Chou, Quan Qin, Shi Li,
- Abstract要約: SerialBEHRTはSciBERTを拡張したドメイン整列基盤モデルである。
我々は, 抗生物質感受性予測の課題において, その効果を評価した。
- 参考スコア(独自算出の注目度): 1.585843510099207
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The emergence of foundation models in healthcare has opened new avenues for learning generalizable representations from large scale clinical data. Yet, existing approaches often struggle to reconcile the tabular and event based nature of Electronic Health Records (EHRs) with the sequential priors of natural language models. This structural mismatch limits their ability to capture longitudinal dependencies across patient encounters. We introduce SerialBEHRT, a domain aligned foundation model that extends SciBERT through additional pretraining on structured EHR sequences. SerialBEHRT is designed to encode temporal and contextual relationships among clinical events, thereby producing richer patient representations. We evaluate its effectiveness on the task of antibiotic susceptibility prediction, a clinically meaningful problem in antibiotic stewardship. Through extensive benchmarking against state of the art EHR representation strategies, we demonstrate that SerialBEHRT achieves superior and more consistent performance, highlighting the importance of temporal serialization in foundation model pretraining for healthcare.
- Abstract(参考訳): 医療基盤モデルの出現は、大規模臨床データから一般化可能な表現を学習するための新たな道を開いた。
しかし、既存のアプローチは、Electronic Health Records(EHRs)の表やイベントベースの性質と、自然言語モデルの逐次的な先行性との整合に苦慮することが多い。
この構造的ミスマッチは、患者が遭遇する時間的依存関係をキャプチャする能力を制限している。
本稿では、SciBERTを拡張したドメイン整列基盤モデルであるSerialBEHRTを紹介する。
SerialBEHRTは、臨床イベント間の時間的および文脈的関係を符号化して、よりリッチな患者表現を生成するように設計されている。
我々は, 抗生物質感受性予測の課題において, その効果を評価した。
最先端のEHR表現戦略に対する広範なベンチマークを通じて、SerialBEHRTは、医療のための基礎モデル事前トレーニングにおいて、時間的シリアライズの重要性を強調し、より優れた、より一貫性のあるパフォーマンスを達成することを実証する。
関連論文リスト
- CEHR-XGPT: A Scalable Multi-Task Foundation Model for Electronic Health Records [9.583050730170557]
CEHR-XGPTは、ERHRデータの汎用基盤モデルである。
特徴表現、ゼロショット予測、合成データ生成の3つの重要な機能を統合する。
3つのタスクすべてに対して強力なパフォーマンスを示し、外部データセットに効果的に一般化する。
論文 参考訳(メタデータ) (2025-09-03T18:50:03Z) - Time-Aware Attention for Enhanced Electronic Health Records Modeling [8.4225455796455]
TALE-EHR は Transformer ベースのフレームワークで,連続的な時間的ギャップを明示的にモデル化する,新たなタイムアウェアアテンション機構を備えている。
本手法は, 疾患進展予測などのタスクにおいて, 最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-07-20T07:32:41Z) - From EHRs to Patient Pathways: Scalable Modeling of Longitudinal Health Trajectories with LLMs [38.49879425944787]
本稿では,多様な電子健康記録(EHR)データを構造化表現に変換することで,患者経路モデリングの新しい手法を提案する。
本稿では,長期的文脈をトピック固有の要約トークンに組み込む新しい要約機構を導入し,テキストのみの性能を向上させる。
論文 参考訳(メタデータ) (2025-06-05T09:54:01Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Temporal Entailment Pretraining for Clinical Language Models over EHR Data [9.584923572354045]
臨床領域における言語モデルのための新しい時間的包含事前学習目標を提案する。
本手法は, EHRセグメントを時間的に順序付けられた文対として定式化し, 後の状態が先行状態に関係しているか, 矛盾しているか, 中立であるかを決定するようモデルを訓練する。
論文 参考訳(メタデータ) (2025-04-25T07:30:38Z) - HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。