論文の概要: A Randomized Controlled Trial and Pilot of Scout: an LLM-Based EHR Search and Synthesis Platform
- arxiv url: http://arxiv.org/abs/2604.26953v1
- Date: Sat, 07 Mar 2026 22:28:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.239543
- Title: A Randomized Controlled Trial and Pilot of Scout: an LLM-Based EHR Search and Synthesis Platform
- Title(参考訳): ランダム化制御試験とスカウトパイロット--LLMによるEHR探索と合成プラットフォーム
- Authors: Michael Gao, Suresh Balu, William Knechtle, Kartik Pejavara, William Jeck, Matthew Ellis, Jason Thieling, Blake Cameron, Jason Tatreau, Tareq Aljurf, Henry Foote, Michael Revoir, Marshall Nichols, Matthew Gardner, William Ratliff, Bradley Hintze, Angelo Milazzo, Sreekanth Vemulapalli,
- Abstract要約: 我々は、臨床医が自然言語を用いてEHRデータをクエリできるEHR検索合成プラットフォームであるScoutを開発した。
スカウトはタスク完了時間を37.6%削減し、作業負荷を著しく削減した。
スカウトは、EHRのみで完了したタスクに対する正確さ、完全性、および関連性を維持した。
- 参考スコア(独自算出の注目度): 1.3680778971360474
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clinical documentation and data retrieval within Electronic Health Records (EHRs) contribute substantially to clinician workload and burnout. To address this, we developed Scout, an LLM-based EHR search and synthesis platform that enables clinicians to query EHR data using natural language. Each response includes citations linking each claim to the original data source, facilitating easy verification of generated content. We conducted a prospective randomized, evaluator-blinded crossover trial across seven clinical specialties (20 participants, 200 structured cases). Participants completed realistic clinical tasks using either Scout or the EHR alone, with outcomes including time to completion, NASA Task Load Index workload scores, and blinded expert adjudication of accuracy, completeness, and relevance. Scout reduced task completion time by 37.6% and significantly decreased perceived workload, with the largest reductions in mental demand, effort, and temporal demand. Non-inferiority analyses showed that tasks completed with Scout maintained accuracy, completeness, and relevance relative to tasks completed with the EHR-only. A concurrent pilot deployment across over 200 users and more than 20 specialties generated over 6,600 interactions in three months, revealing diverse clinical and administrative use cases. Automated evaluation using an LLM-as-judge framework identified errors at low rates. Subsequent manual review of a subset of outputs revealed that most claims flagged by the automated judge as errors were in fact supported by the patient chart, demonstrating the importance of human validation. These findings provide early trial-based evidence that LLM-powered EHR tools can meaningfully reduce clinical and administrative workloads while maintaining output quality.
- Abstract(参考訳): EHR(Electronic Health Records)内の臨床ドキュメントとデータ検索は、臨床の作業負荷とバーンアウトに大きく貢献する。
そこで我々は,LLMをベースとしたEHR検索・合成プラットフォームであるScoutを開発した。
各レスポンスには、各クレームと元のデータソースをリンクする引用が含まれており、生成されたコンテンツの容易な検証を容易にする。
臨床専門医7名(20名, 構造化症例200名)を対象に, ランダム化, 評価者によるクロスオーバー試験を行った。
参加者はスカウトか EHR単独で現実的な臨床タスクを完了し、完了までの時間、NASAのタスク負荷指数の作業負荷スコア、正確性、完全性、関連性の専門的偏見を含む結果を得た。
スカウトはタスク完了時間を37.6%削減し、作業負荷を著しく削減した。
非劣等性分析では、スカウトで完了したタスクは、EHRで完了したタスクに対して正確性、完全性、および関連性を維持していた。
200人以上のユーザと20以上の専門職にまたがる同時パイロットデプロイメントは、3ヶ月で6600件以上のインタラクションを発生させ、さまざまな臨床および管理上のユースケースを明らかにした。
LLM-as-judgeフレームワークによる自動評価により,低レートでの誤りが検出された。
その後、アウトプットのサブセットを手作業でレビューした結果、自動審査員がエラーとして警告したほとんどの主張は、実際に患者のチャートで支持され、人間の検証の重要性が示された。
これらの知見は,LSMを用いたERHツールが,アウトプット品質を維持しつつ,臨床的および管理的負荷を有意義に低減できることを示す。
関連論文リスト
- Detecting Clinical Discrepancies in Health Coaching Agents: A Dual-Stream Memory and Reconciliation Architecture [71.46525715889656]
汎用エージェントメモリシステムは、ユーザの最新のステートメントで古い事実を上書きすることでコヒーレンスを最適化する。
本稿では,患者の物語を構造化された臨床記録から厳密に分離するDual-Stream Memory Architectureを提案する。
675日間のウェルネスコーチングセッションにおいて,26名の患者を対象にこのアーキテクチャを評価した。
論文 参考訳(メタデータ) (2026-04-29T17:59:28Z) - Agentic Cognitive Profiling: Realigning Automated Alzheimer's Disease Detection with Clinical Construct Validity [66.94391219005291]
本稿では,臨床プロトコルロジックによる自動スクリーニングを実現するエージェント認知プロファイリング(ACP)を提案する。
我々の設計の中心は、すべての定量化を決定論的関数呼び出しに委譲することで、測定から意味的理解を分離することである。
ACPは、タスク試験で90.5%のスコアマッチ率、AD予測で85.3%の精度を達成し、一般的な基準を上回っている。
論文 参考訳(メタデータ) (2026-03-18T06:15:35Z) - Real-world validation of a multimodal LLM-powered pipeline for High-Accuracy Clinical Trial Patient Matching leveraging EHR data [0.0]
臨床試験における患者採用は、複雑な資格基準と労働集約性チャートのレビューによって妨げられている。
EHRから抽出した未処理文書を用いて,患者と医療のマッチングを自動化する統合フリーのLLMパイプラインを提案する。
提案手法は,(1)最も複雑な基準の評価を可能にする新たな推論-LLMパラダイム,(2)画像からテキストへの変換を欠くことなく医療記録を解釈する最新のLCMの視覚的能力,(3)効率的な医療記録検索のためのマルチモーダル埋め込みを活用する。
論文 参考訳(メタデータ) (2025-03-19T16:12:11Z) - Almanac Copilot: Towards Autonomous Electronic Health Record Navigation [4.939203290543146]
臨床医は臨床文書に多くの時間を費やす。
紙ベースの記録からの移行はクリニックウェルネスと負の関連がある。
本稿では,EMR特有のタスクで臨床医を支援する自律型エージェントであるAlmanac Copilotを紹介する。
論文 参考訳(メタデータ) (2024-04-30T22:55:27Z) - EHRNoteQA: An LLM Benchmark for Real-World Clinical Practice Using Discharge Summaries [9.031182965159976]
大規模言語モデル(LLM)は、大規模で複雑なデータを効率的に分析する可能性を示している。
我々は,MIMIC-IV EHR上に構築された新しいベンチマークであるEHRNoteQAを紹介した。
EHRNoteQAには、複数の放電サマリーにまたがる情報を必要とし、実際の臨床検査の複雑さと多様性を反映した8つの多様なトピックをカバーする質問が含まれている。
論文 参考訳(メタデータ) (2024-02-25T09:41:50Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。