論文の概要: EHR-R1: A Reasoning-Enhanced Foundational Language Model for Electronic Health Record Analysis
- arxiv url: http://arxiv.org/abs/2510.25628v1
- Date: Wed, 29 Oct 2025 15:32:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.794168
- Title: EHR-R1: A Reasoning-Enhanced Foundational Language Model for Electronic Health Record Analysis
- Title(参考訳): EHR-R1:電子健康記録解析のための推論強化基礎言語モデル
- Authors: Yusheng Liao, Chaoyi Wu, Junwei Liu, Shuyang Jiang, Pengcheng Qiu, Haowen Wang, Yun Yue, Shuai Zhen, Jian Wang, Qianrui Fan, Jinjie Gu, Ya Zhang, Yanfeng Wang, Yu Wang, Weidi Xie,
- Abstract要約: EHR-Insは大規模で総合的なEHR推論命令データセットである。
また,EHR分析に適した最大72Bパラメータを持つ推理強化LDMであるEHR-R1を開発した。
最後に、MIMIC-IVからキュレートされた新しいベンチマークであるEHR-Benchを紹介し、42のタスクにまたがる。
- 参考スコア(独自算出の注目度): 78.05962117947259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic Health Records (EHRs) contain rich yet complex information, and their automated analysis is critical for clinical decision-making. Despite recent advances of large language models (LLMs) in clinical workflows, their ability to analyze EHRs remains limited due to narrow task coverage and lack of EHR-oriented reasoning capabilities. This paper aims to bridge the gap, specifically, we present EHR-Ins, a large-scale, comprehensive EHR reasoning instruction dataset, comprising 300k high-quality reasoning cases and 4M non-reasoning cases across 42 distinct EHR tasks. Its core innovation is a thinking-graph-driven framework that enables to generate high-quality reasoning data at scale. Based on it, we develop EHR-R1, a series of reasoning-enhanced LLMs with up to 72B parameters tailored for EHR analysis. Through a multi-stage training paradigm, including domain adaptation, reasoning enhancement, and reinforcement learning, EHR-R1 systematically acquires domain knowledge and diverse reasoning capabilities, enabling accurate and robust EHR analysis. Lastly, we introduce EHR-Bench, a new benchmark curated from MIMIC-IV, spanning 42 tasks, to comprehensively assess reasoning and prediction across EHR scenarios. In experiments, we show that the resulting EHR-R1 consistently outperforms state-of-the-art commercial and open-source LLMs (including DeepSeek-V3 and GPT-4o), surpassing GPT-4o by over 30 points on MIMIC-Bench and achieving a 10\% higher zero-shot AUROC on EHRSHOT. Collectively, EHR-Ins, EHR-R1, and EHR-Bench have significantly advanced the development for more reliable and clinically relevant EHR analysis.
- Abstract(参考訳): 電子健康記録 (Electronic Health Records, EHRs) は、リッチだが複雑な情報を含んでいる。
臨床ワークフローにおける大規模言語モデル(LLM)の最近の進歩にもかかわらず、タスクカバレッジの狭さや、EHR指向推論能力の欠如により、EHRの分析能力は制限されている。
本稿では,このギャップを埋めることを目的とする。具体的には,大規模かつ総合的なEHR推論命令データセットであるEHR-Insについて述べる。
その中核となるイノベーションは思考グラフ駆動のフレームワークで、大規模に高品質な推論データを生成することができる。
そこで本研究では,EHR分析に適した最大72Bパラメータを持つ推理強化LLMであるEHR-R1を開発した。
ドメイン適応、推論強化、強化学習を含む多段階のトレーニングパラダイムを通じて、EHR-R1は、ドメイン知識と多様な推論能力を体系的に取得し、正確で堅牢なEHR分析を可能にする。
最後に、42のタスクにまたがるMIMIC-IVから算出された新しいベンチマークであるEHR-Benchを紹介し、EHRシナリオ全体の推論と予測を包括的に評価する。
実験の結果,EHR-R1 は最先端の商用およびオープンソース LLM (DeepSeek-V3 や GPT-4o を含む) を一貫して上回り,MIMIC-Bench では GPT-4o を30点以上上回り,EHRSHOT では 10 % のゼロショット AUROC を達成していることがわかった。
EHR-Ins, EHR-R1, EHR-Bench はより信頼性が高く臨床的に関係のある EHR 分析の開発に大きく進歩している。
関連論文リスト
- Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Toward Better EHR Reasoning in LLMs: Reinforcement Learning with Expert Attention Guidance [9.106439376182513]
電子健康記録(EHR)推論のための大規模言語モデル(LLM)は、正確で一般化可能な臨床予測を可能にするために不可欠である。
EAG-RL は LLM の EHR 推論能力を高めるために設計された新しい2段階学習フレームワークである。
EAG-RLは、まず、専門家誘導モンテカルロ木探索を用いて、高品質で段階的な推論軌道を構築する。
論文 参考訳(メタデータ) (2025-08-19T07:24:48Z) - Retrieval-Augmented Perception: High-Resolution Image Perception Meets Visual RAG [79.61269381878547]
マルチモーダル大言語モデル(MLLM)における高分解能画像認識の課題
本稿では,従来の専門的アプローチから脱却し,MLLMの長文能力を高めることにより,最も基本的な考え方を人事知覚に再考する。
本研究では,空間的コンテキストを保ちながら関連する画像作物を抽出・融合する学習自由フレームワークであるRetrieval-Augmented Perception (RAP)を提案する。
論文 参考訳(メタデータ) (2025-03-03T06:40:21Z) - IntelliCare: Improving Healthcare Analysis with Variance-Controlled Patient-Level Knowledge from Large Language Models [14.709233593021281]
LLM(Large Language Models)からの外部知識の統合は、医療予測を改善するための有望な道を示す。
我々は,LLMを活用して高品質な患者レベルの外部知識を提供する新しいフレームワークであるIntelliCareを提案する。
IntelliCareは患者のコホートを特定し、LCMの理解と生成を促進するためにタスク関連統計情報を利用する。
論文 参考訳(メタデータ) (2024-08-23T13:56:00Z) - Multi-task Heterogeneous Graph Learning on Electronic Health Records [22.218522445858344]
EHRモデリングのための新しいフレームワーク MulT-EHR (Multi-Task EHR) を提案する。
そこで本研究では,因果推論フレームワークをベースとしたデノナイジングモジュールを導入し,重度のコンバウンディング効果の調整を行う。
マルチタスク学習モジュールを設計し、タスク間知識を活用してトレーニングプロセスの正規化を行う。
論文 参考訳(メタデータ) (2024-08-14T14:06:13Z) - ICU Bloodstream Infection Prediction: A Transformer-Based Approach for EHR Analysis [0.0]
本稿では,集中治療室(ICU)における電子健康記録(EHR)データの予測分析を目的とした新しいフレームワークであるRatchetEHRを紹介する。
R RatchetEHRは、RNN、LSTM、XGBoostなど、他の方法と比較して優れた予測性能を示している。
RatchetEHRにおける重要なイノベーションは、Graph Convolutional Transformer (GCT)コンポーネントの統合である。
論文 参考訳(メタデータ) (2024-05-01T19:00:30Z) - RLHF Deciphered: A Critical Analysis of Reinforcement Learning from Human Feedback for LLMs [49.386699863989335]
大きな言語モデル(LLM)を訓練し、人間の効果的なアシスタントとして機能させるには、慎重に検討する必要がある。
有望なアプローチとして、人間からのフィードバック(RLHF)からの強化学習がある。
本稿では、強化学習原理のレンズを通してRLHFを分析し、その基礎を理解する。
論文 参考訳(メタデータ) (2024-04-12T15:54:15Z) - Machine Learning for Administrative Health Records: A Systematic Review
of Techniques and Applications [5.353552655309808]
行政健康記録 (Administrative Health Records, AHR) は、行政上の目的で収集された EHR のサブセットである。
本稿では、AHRに基づく研究を体系的にレビューし、70の関連研究を分析し、複数のデータベースにまたがる。
AHRに基づく研究は互いに切り離されているが、健康情報学研究におけるAHRの利用は著しく加速している。
論文 参考訳(メタデータ) (2023-08-27T22:34:10Z) - SANSformers: Self-Supervised Forecasting in Electronic Health Records
with Attention-Free Models [48.07469930813923]
本研究は,医療施設への患者訪問数を予測することにより,医療サービスの需要を予測することを目的とする。
SNSformerは、特定の帰納バイアスを設計し、EHRデータの特異な特徴を考慮に入れた、注意のない逐次モデルである。
本研究は, 各種患者集団を対象とした医療利用予測の修正における, 注意力のないモデルと自己指導型事前訓練の有望な可能性について考察した。
論文 参考訳(メタデータ) (2021-08-31T08:23:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。