論文の概要: RePrompT: Recurrent Prompt Tuning for Integrating Structured EHR Encoders with Large Language Models
- arxiv url: http://arxiv.org/abs/2604.17725v1
- Date: Mon, 20 Apr 2026 02:20:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.662263
- Title: RePrompT: Recurrent Prompt Tuning for Integrating Structured EHR Encoders with Large Language Models
- Title(参考訳): RePrompT: 構造化HRエンコーダと大規模言語モデルの統合のための繰り返しプロンプトチューニング
- Authors: Arya Hadizadeh Moghaddam, Drew Ross, Mohsen Nayebi Kerdabadi, Dongjie Wang, Zijun Yao,
- Abstract要約: 本稿では,構造化EHRエンコーダを即時チューニングにより統合する時間認識フレームワークRePrompTを紹介する。
MIMIC-IIIとMIMIC-IVの実験では、RePrompTはEHRベースのベースラインとLLMベースのベースラインの両方を一貫して上回っている。
- 参考スコア(独自算出の注目度): 12.004161606345084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have shown strong promise for mining Electronic Health Records (EHRs) by reasoning over longitudinal clinical information to capture context-rich patient trajectories. However, leveraging LLMs for structured EHRs (e.g., standardized diagnosis and medication codes) presents two key challenges. First, translating time-stamped EHR sequences into plain text can obscure both temporal structure and code identities, weakening the ability to capture code co-occurrence and longitudinal regularities. Second, unlike cohort-trained predictive models that learn a shared, task-aligned representation space across patients, LLMs are often applied in a case-isolated inference setting where each patient is processed independently without leveraging population-level patterns. To address these challenges, we introduce RePrompT, a time-aware LLM framework that integrates structured EHR encoders through prompt tuning, without modifying underlying architectures. Specifically, RePrompT recurrently incorporates latent states from prior visits to preserve longitudinal information, and injects population-level information through trainable prompt tokens derived from a cohort-trained, task-aligned EHR encoder. Experiments on MIMIC-III and MIMIC-IV demonstrate that RePrompT consistently outperforms both EHR-based and LLM-based baselines across multiple clinical prediction tasks.
- Abstract(参考訳): 大規模言語モデル (LLMs) は, 文脈に富む患者軌跡を捉えるために, 経時的臨床情報を解析することにより電子健康記録 (EHRs) のマイニングを強く約束している。
しかしながら、構造化EMH(例えば、標準化された診断と治療基準)にLLMを活用することは、2つの重要な課題を提示する。
まず、タイムスタンプされたEHRシーケンスをプレーンテキストに変換することで、時間的構造とコードの同一性の両方を曖昧にし、コード共起と縦長の規則性をキャプチャする能力を弱めることができる。
第2に、患者間で共有されたタスク整合表現空間を学習するコホート学習予測モデルとは異なり、各患者が集団レベルのパターンを活用せずに独立に処理されるケース分離推論環境では、LLMがしばしば適用される。
これらの課題に対処するため、我々は、基盤となるアーキテクチャを変更することなく、即時チューニングにより構造化されたEHRエンコーダを統合する、タイムアウェアなLLMフレームワークであるRePrompTを紹介した。
具体的には、RePrompTは、前回の訪問から潜伏状態に繰り返し組み込んで長手情報を保持し、コホート訓練されたタスク対応のEHRエンコーダから導出される訓練可能なプロンプトトークンを通じて、人口レベルの情報を注入する。
MIMIC-IIIとMIMIC-IVの実験では、RePrompTは複数の臨床予測タスクにおいて、EHRベースのベースラインとLLMベースのベースラインを一貫して上回っている。
関連論文リスト
- Towards Multimodal Lifelong Understanding: A Dataset and Agentic Baseline [58.585692088008905]
MM-Lifelongはマルチモーダルライフロング理解のために設計されたデータセットである。
撮影時間は181.1時間で、日、週、月の各スケールにまたがって構成され、様々な時間密度を捉えている。
論文 参考訳(メタデータ) (2026-03-05T18:52:12Z) - Large Language Models are Powerful Electronic Health Record Encoders [2.310631440585048]
汎用大規模言語モデルは、下流臨床予測タスクの表現にERHをエンコードするために使用される。
本手法は, 機関固有の訓練を必要とせず, 医用コードにテキスト記述を組み込むことが可能である。
LLMに基づくモデルでは, 発症, 入院, 死亡率の予測に優れた性能を示し, 集団に対する堅牢性, コーディングシフトを示す。
論文 参考訳(メタデータ) (2025-02-24T18:30:36Z) - HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation [51.509573838103854]
医用画像セグメンテーションのための半教師付き学習フレームワークであるプログレッシブ平均教師(PMT)を提案する。
我々のPMTは、トレーニングプロセスにおいて、堅牢で多様な特徴を学習することで、高忠実な擬似ラベルを生成する。
CT と MRI の異なる2つのデータセットに対する実験結果から,本手法が最先端の医用画像分割法より優れていることが示された。
論文 参考訳(メタデータ) (2024-09-08T15:02:25Z) - Prompting Large Language Models for Zero-Shot Clinical Prediction with
Structured Longitudinal Electronic Health Record Data [7.815738943706123]
大規模言語モデル(LLM)は、伝統的に自然言語処理に向いている。
本研究では, GPT-4 などの LLM の EHR データへの適応性について検討する。
EHRデータの長手性、スパース性、知識を注入した性質に対応するため、本研究は特定の特徴を考慮に入れている。
論文 参考訳(メタデータ) (2024-01-25T20:14:50Z) - An Iterative Optimizing Framework for Radiology Report Summarization with ChatGPT [80.33783969507458]
放射線医学報告の「印象」セクションは、放射線医と他の医師とのコミュニケーションにとって重要な基盤である。
近年の研究では、大規模医療用テキストデータを用いた印象自動生成の有望な成果が得られている。
これらのモデルは、しばしば大量の医療用テキストデータを必要とし、一般化性能が劣る。
論文 参考訳(メタデータ) (2023-04-17T17:13:42Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。