論文の概要: ReToP: Learning to Rewrite Electronic Health Records for Clinical Prediction
- arxiv url: http://arxiv.org/abs/2601.19286v1
- Date: Tue, 27 Jan 2026 07:20:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.222912
- Title: ReToP: Learning to Rewrite Electronic Health Records for Clinical Prediction
- Title(参考訳): ReToP: 臨床診断のための電子健康記録の書き直しを学ぶ
- Authors: Jesus Lovon-Melgarejo, Jose G. Moreno, Christine Damase-Michel, Lynda Tamine,
- Abstract要約: 大言語モデル(LLM)は、臨床予測タスクのためのパラメトリック医療知識データによって、この問題に対処するための進歩を可能にした。
既存のアプローチの多くは、予測タスクからの信号を完全に統合することなく、ELHエンコーダやERHコンプリートモジュールとしてLLMをデプロイするという意味で、基本的にタスクに依存しない。
本稿では,この制限に対処するLLMベースのフレームワークであるRewrite-To-Predict(ReToP)を提案する。
- 参考スコア(独自算出の注目度): 1.0874597293913013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic Health Records (EHRs) provide crucial information for clinical decision-making. However, their high-dimensionality, heterogeneity, and sparsity make clinical prediction challenging. Large Language Models (LLMs) allowed progress towards addressing this challenge by leveraging parametric medical knowledge to enhance EHR data for clinical prediction tasks. Despite the significant achievements made so far, most of the existing approaches are fundamentally task-agnostic in the sense that they deploy LLMs as EHR encoders or EHR completion modules without fully integrating signals from the prediction tasks. This naturally hinders task performance accuracy. In this work, we propose Rewrite-To-Predict (ReToP), an LLM-based framework that addresses this limitation through an end-to-end training of an EHR rewriter and a clinical predictor. To cope with the lack of EHR rewrite training data, we generate synthetic pseudo-labels using clinical-driven feature selection strategies to create diverse patient rewrites for fine-tuning the EHR rewriter. ReToP aligns the rewriter with prediction objectives using a novel Classifier Supervised Contribution (CSC) score that enables the EHR rewriter to generate clinically relevant rewrites that directly enhance prediction. Our ReToP framework surpasses strong baseline models across three clinical tasks on MIMIC-IV. Moreover, the analysis of ReToP shows its generalizability to unseen datasets and tasks with minimal fine-tuning while preserving faithful rewrites and emphasizing task-relevant predictive features.
- Abstract(参考訳): 電子健康記録 (Electronic Health Records, EHRs) は、臨床の意思決定に重要な情報を提供する。
しかし、その高次元性、異質性、および空間性は臨床予測を困難にしている。
大規模言語モデル (LLM) は, 臨床予測タスクにおいて, EHRデータを強化するためにパラメトリックな医療知識を活用することで, この課題に対処するための進歩を可能にした。
これまでの大きな成果にもかかわらず、既存のアプローチのほとんどは、予測タスクからの信号を完全に統合することなく、ELHエンコーダやERHコンプリートモジュールとしてLSMをデプロイするという意味で、基本的にはタスクに依存しない。
これは当然、タスクパフォーマンスの精度を損なう。
本研究では,この制限に対処するLLMベースのフレームワークであるRewrite-To-Predict(ReToP)を提案する。
EHR書き直し訓練データの欠如に対処するため,臨床駆動型特徴選択戦略を用いて合成擬似ラベルを生成し,EHR書き直しを微調整するための多様な患者書き直しを作成する。
ReToPは、新しい分類器監督貢献(CSC)スコアを用いて、リライターを予測目標と整合させ、EHRリライターは、予測を直接的に強化する臨床的に関連するリライトを生成する。
当社のReToPフレームワークはMIMIC-IVの3つの臨床タスクにまたがる強力なベースラインモデルを超えている。
さらに、ReToPの分析は、忠実な書き直しを保持し、タスク関連予測機能を強調しながら、最小限の微調整でデータセットやタスクを発見できないように一般化可能であることを示している。
関連論文リスト
- Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Bridging Electronic Health Records and Clinical Texts: Contrastive Learning for Enhanced Clinical Tasks [0.0]
本稿では,構造化EHRデータの潜在表現を非構造化放電要約ノートと整合させるフレームワークを提案する。
ペアのEHRとテキストの埋め込みをまとめて、障害のないものを分解する。
その結果,臨床ノートからEHRベースのパイプラインにドメイン知識を統合する効果が示された。
論文 参考訳(メタデータ) (2025-05-23T09:04:49Z) - Large Language Models are Powerful Electronic Health Record Encoders [2.310631440585048]
汎用大規模言語モデルは、下流臨床予測タスクの表現にERHをエンコードするために使用される。
本手法は, 機関固有の訓練を必要とせず, 医用コードにテキスト記述を組み込むことが可能である。
LLMに基づくモデルでは, 発症, 入院, 死亡率の予測に優れた性能を示し, 集団に対する堅牢性, コーディングシフトを示す。
論文 参考訳(メタデータ) (2025-02-24T18:30:36Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Learnable Prompt as Pseudo-Imputation: Rethinking the Necessity of Traditional EHR Data Imputation in Downstream Clinical Prediction [20.680805655245383]
EHR分析を支援するための新しいトレーニングプロトコルとして,PAI(Learningable Prompt as Pseudo-Imputation)を提案する。
PAIはもはやインプットデータを導入しないが、ダウンストリームモデルの暗黙の選好を欠落値にモデル化するための学習可能なプロンプトを構築する。
論文 参考訳(メタデータ) (2024-01-30T07:19:36Z) - Prompting Large Language Models for Zero-Shot Clinical Prediction with
Structured Longitudinal Electronic Health Record Data [7.815738943706123]
大規模言語モデル(LLM)は、伝統的に自然言語処理に向いている。
本研究では, GPT-4 などの LLM の EHR データへの適応性について検討する。
EHRデータの長手性、スパース性、知識を注入した性質に対応するため、本研究は特定の特徴を考慮に入れている。
論文 参考訳(メタデータ) (2024-01-25T20:14:50Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。