論文の概要: Evaluating the Utility of Personal Health Records in Personalized Health AI
- arxiv url: http://arxiv.org/abs/2605.18937v1
- Date: Mon, 18 May 2026 17:55:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.892122
- Title: Evaluating the Utility of Personal Health Records in Personalized Health AI
- Title(参考訳): パーソナライズされた健康AIにおける個人健康記録の有用性の評価
- Authors: Rory Sayres, Kejia Chen, Ayush Jain, Matthew Thompson, Jonathan Richina, Xiang Yin, Jimmy Hu, Fan Zhang, Bob Lou, Mike Sanchez, Ines Mezerreg, Meredith Schreier, Hamsa Subramaniam, I-Ching Lee, Yugang Jia, Daniel Mcduff, Yossi Matias, Avinatan Hassidim, Dale Webster, Yun Liu, Jackie Barr, Quang Duong,
- Abstract要約: 患者管理のPHR(Personal Health Records)は、患者の健康をよりよく理解できるようにすると約束している。
PHRから臨床データをコンテキストとして提供した場合,大規模言語モデル (LLM, Gemini 3.0 Flash) の可能性を評価し, ユーザの健康診断に有用な回答を提供する。
PHRデータを用いた全ての質問タイプに対する回答の有用性は大幅に改善される。
- 参考スコア(独自算出の注目度): 20.86103585391456
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Patient-managed Personal Health Records (PHRs) promises to empower patients to better understand their health; but information in the record is complex, potentially hindering insights. In this study, we assess the potential of large language models (LLMs, Gemini 3.0 Flash) to provide helpful answers to user health queries, when provided clinical data from PHRs as context. A total of 2,257 user queries were drawn from 3 different distributions to represent patient questions: shorter web search queries, longer questions derived from templates of chatbot conversations, and questions patients asked to their healthcare team (patient calls). Queries were matched with de-identified PHRs (from a pool of 1,945). Gemini responses were generated (1) without PHR context; (2) with a basic summary of demographics, conditions, and medications; (3) with full, extensive clinical notes. For evaluation, we leveraged an existing rating framework (SHARP), and developed a new framework for specific error modes when interpreting PHRs. Evaluation was performed using autoraters for the full set, and with clinician ratings for a subset (n=95), with both sets of raters knowing the full PHR context. We see significant improvements in the helpfulness of answers to all question types with PHR data (p < 0.001, paired t-test). We also observe potential gains in safety, accuracy, relevance and personalization of answers. Our PHR evaluation framework further identifies gaps in LLM understanding of particular aspects of complex PHRs, such as temporal disorientation, and rare but meaningful confabulations. These results suggest potential for PHR data to help people with a wide range of user needs; and provide a framework for monitoring for gaps in LLM answers based on PHR context. This study motivates further work to assess and realize potential benefits to users from understanding their health records.
- Abstract(参考訳): 患者管理のPHR(Personal Health Records)は、患者が自分の健康をよりよく理解できるようにすると約束している。
本研究では,大規模言語モデル (LLMs, Gemini 3.0 Flash) の可能性を評価し,PHRから臨床データをコンテキストとして提供した場合に,ユーザの健康状態に対する有用な回答を提供する。
ウェブ検索クエリの短縮,チャットボット会話のテンプレートからの長い質問,医療チームに質問された質問(患者電話)の3つの異なる分布から,合計2,257件のユーザクエリが抽出された。
クエリは、未同定のPHR(1,945プール)と一致した。
ジェミニの反応は,(1)PHRの文脈を欠いたもの,(2)人口動態,条件,薬物の基本的な概要,(3)完全かつ広範な臨床記録が得られた。
評価のために、既存の評価フレームワーク(SHARP)を活用し、PHRを解釈する際の特定のエラーモードのための新しいフレームワークを開発した。
フルセットのオートレーダを用いて評価を行い、サブセット(n=95)で臨床評価を行った。
PHRデータを用いた全ての質問タイプ(p < 0.001, paired t-test)に対する回答の有用性に大きな改善が見られた。
答の安全性、正確性、妥当性、パーソナライゼーションの潜在的な向上も観察する。
我々のPHR評価フレームワークは、時間的不整合や稀だが有意義な相反といった複雑なPHRの特定の側面のLLM理解のギャップをさらに特定する。
これらの結果から,PHRデータによるユーザニーズの広範化を支援する可能性が示唆され,PHRコンテキストに基づいたLLM回答のギャップを監視するためのフレームワークが提供される。
本研究は、ユーザーの健康記録の理解から潜在的利益を評価・実現するためのさらなる取り組みを動機づけるものである。
関連論文リスト
- HealthNLP_Retrievers at ArchEHR-QA 2026: Cascaded LLM Pipeline for Grounded Clinical Question Answering [4.835744579415159]
本稿では,HealthNLP_Retrieversチームが開発したシステムについて述べる。
提案手法では,Gemini 2.5 Proの大規模言語モデルを利用した多段階カスケードパイプラインを使用する。
本アーキテクチャは,(1)患者問合せを要約する数発の問合せ修正ユニット,(2)臨床文章をリコールする動詞ベースのエビデンススコアラ,(3)専門職の回答を合成する接地応答生成器の4つの統合モジュールから構成される。
論文 参考訳(メタデータ) (2026-04-29T16:47:20Z) - A Dataset for Addressing Patient's Information Needs related to Clinical Course of Hospitalization [15.837772594006038]
ArchEHR-QAは、集中治療室と救急部門の設定から現実の患者をベースとした、専門家による注釈付きデータセットである。
症例は、公衆衛生フォーラムへの患者による質問、臨床医が解釈した質問、関連する臨床ノートの抜粋、および臨床医が認可した回答である。
答えファーストのプロンプトアプローチは一貫して最善を尽くし、ラマ4は最高得点を獲得した。
論文 参考訳(メタデータ) (2025-06-04T16:55:08Z) - Follow-up Question Generation For Enhanced Patient-Provider Conversations [0.11309478649967242]
FollowupQは非同期医療会話を強化するための新しいフレームワークである。
FollowupQは、患者メッセージとEHRデータを処理し、パーソナライズされたフォローアップ質問を生成する。
必要なプロバイダのフォローアップ通信を34%削減する。
また、実データと合成データのパフォーマンスも17%向上し、5%向上した。
論文 参考訳(メタデータ) (2025-03-21T19:40:53Z) - LlaMADRS: Prompting Large Language Models for Interview-Based Depression Assessment [75.44934940580112]
LlaMADRSは、オープンソースのLarge Language Models(LLM)を利用して、うつ病の重症度評価を自動化する新しいフレームワークである。
本研究は,クリニカルインタヴューの解釈・スコアリングにおけるモデル指導のために,慎重に設計された手がかりを用いたゼロショットプロンプト戦略を用いている。
実世界における236件のインタビューを対象とし,臨床評価と強い相関性を示した。
論文 参考訳(メタデータ) (2025-01-07T08:49:04Z) - Two-Layer Retrieval-Augmented Generation Framework for Low-Resource Medical Question Answering Using Reddit Data: Proof-of-Concept Study [4.769236554995528]
本稿では、健康関連トピックに関連する新たな問題に答える医療質問に対する検索強化世代アーキテクチャを提案する。
筆者らのフレームワークは,大量のユーザ生成ソーシャルメディアデータから医療質問に回答するために,個別の要約と集約された要約を生成する。
GPT-4 と Nous-Hermes-2-7B-DPO を用いて評価すると, 関連性, 長さ, 幻覚, 包括性, コヒーレンスに比較して高いスコアが得られた。
論文 参考訳(メタデータ) (2024-05-29T20:56:52Z) - K-QA: A Real-World Medical Q&A Benchmark [12.636564634626422]
K-QA(K-QA)は、K Health上での実際の会話から発せられる1,212の患者質問を含むデータセットである。
我々は,K-QAのサブセットを自己完結文に分解するために,内科医のパネルを用いて回答し,手動で分解する。
我々は、いくつかの最先端モデルと、コンテキスト内学習と医学指向の拡張検索スキームの効果を評価した。
論文 参考訳(メタデータ) (2024-01-25T20:11:04Z) - MedAlign: A Clinician-Generated Dataset for Instruction Following with
Electronic Medical Records [60.35217378132709]
大型言語モデル(LLM)は、人間レベルの流布で自然言語の指示に従うことができる。
医療のための現実的なテキスト生成タスクにおけるLCMの評価は依然として困難である。
我々は、EHRデータのための983の自然言語命令のベンチマークデータセットであるMedAlignを紹介する。
論文 参考訳(メタデータ) (2023-08-27T12:24:39Z) - RECAP-KG: Mining Knowledge Graphs from Raw GP Notes for Remote COVID-19
Assessment in Primary Care [45.43645878061283]
本稿では,患者相談の前後に書かれた生のGP医療ノートから知識グラフ構築を行うフレームワークを提案する。
私たちの知識グラフには、既存の患者の症状、その持続時間、重症度に関する情報が含まれています。
本フレームワークを英国における新型コロナウイルス患者の相談ノートに適用する。
論文 参考訳(メタデータ) (2023-06-17T23:35:51Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。