論文の概要: Detecting Clinical Discrepancies in Health Coaching Agents: A Dual-Stream Memory and Reconciliation Architecture
- arxiv url: http://arxiv.org/abs/2604.27045v1
- Date: Wed, 29 Apr 2026 17:59:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.739347
- Title: Detecting Clinical Discrepancies in Health Coaching Agents: A Dual-Stream Memory and Reconciliation Architecture
- Title(参考訳): ヘルス・コーチング・エージェントにおける臨床的差異の検出--二重ストリーム記憶と再調合アーキテクチャ
- Authors: Samuel L Pugh, Eric Yang, Alexander Muir Sutherland, Alessandra Breschi,
- Abstract要約: 汎用エージェントメモリシステムは、ユーザの最新のステートメントで古い事実を上書きすることでコヒーレンスを最適化する。
本稿では,患者の物語を構造化された臨床記録から厳密に分離するDual-Stream Memory Architectureを提案する。
675日間のウェルネスコーチングセッションにおいて,26名の患者を対象にこのアーキテクチャを評価した。
- 参考スコア(独自算出の注目度): 71.46525715889656
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As Large Language Model (LLM) agents transition from single-session tools to persistent systems managing longitudinal healthcare journeys, their memory architectures face a critical challenge: reconciling two imperfect sources of truth. The patient's evolving self-report is current but prone to recall bias, while the Electronic Health Record (EHR) is medically validated but frequently stale. General-purpose agent memory systems optimize for coherence by overwriting older facts with the user's latest statement, a pattern that risks safety failures when applied to clinical data. We introduce a Dual-Stream Memory Architecture that strictly separates the patient narrative from the structured clinical record (FHIR), governed by a dedicated Reconciliation Engine that evaluates every extracted memory against the patient's FHIR profile and classifies discrepancies by type, severity, and the specific FHIR resources involved. We evaluate this architecture on 26 patients across 675 longitudinal wellness coaching sessions, using a hybrid dataset that interleaves real provider-patient transcripts with synthetic, FHIR-grounded clinical scenarios. In isolated testing, the engine detects 84.4% of designed clinical discrepancies with 86.7% safety-critical recall. By coupling extraction and reconciliation evaluation on the same data, we directly quantify a 13.6% error cascade, tracing the degradation to clinical details lost during memory extraction from unstructured conversation rather than to downstream classification errors. These findings establish that validating patient-reported memories against clinical records is both feasible and necessary for safe deployment of longitudinal health agents.
- Abstract(参考訳): 大きな言語モデル(LLM)エージェントは、単一セッションツールから、縦断的なヘルスケアジャーニーを管理する永続的なシステムへと移行する。
エレクトロニック・ヘルス・レコーズ (Electronic Health Record, EHR) は、医学的に検証されているが、しばしば停滞している。
汎用エージェントメモリシステムは、臨床データに適用した場合の安全性障害を危険にさらすパターンである、ユーザの最新の声明で古い事実を上書きすることでコヒーレンスを最適化する。
本稿では,患者のFHIRプロファイルに対して抽出したすべてのメモリを評価し,タイプ,重症度,関連する特定のFHIRリソースを分類し,患者の物語を構造化された臨床記録(FHIR)から厳密に分離するDual-Stream Memory Architectureを提案する。
675症例を対象に,FHIRを基盤とした臨床シナリオと実際の患者書き起こしをインターリーブするハイブリッドデータセットを用いて,26症例を対象に,このアーキテクチャを評価した。
分離試験では、エンジンは設計された臨床上の不一致の84.4%を検知し、86.7%の安全クリティカルなリコールを行う。
同一データ上での抽出と整合性評価を結合することにより,13.6%の誤差カスケードを直接定量化し,ダウンストリーム分類誤差ではなく,非構造化会話からのメモリ抽出中に失われる臨床詳細までトレースする。
これらの結果から, 患者が報告した記憶を臨床記録に当てはめることは可能であり, 長期医療エージェントの安全な配置に必要であることが明らかとなった。
関連論文リスト
- Agentic Cognitive Profiling: Realigning Automated Alzheimer's Disease Detection with Clinical Construct Validity [66.94391219005291]
本稿では,臨床プロトコルロジックによる自動スクリーニングを実現するエージェント認知プロファイリング(ACP)を提案する。
我々の設計の中心は、すべての定量化を決定論的関数呼び出しに委譲することで、測定から意味的理解を分離することである。
ACPは、タスク試験で90.5%のスコアマッチ率、AD予測で85.3%の精度を達成し、一般的な基準を上回っている。
論文 参考訳(メタデータ) (2026-03-18T06:15:35Z) - Continuous Telemonitoring of Heart Failure using Personalised Speech Dynamics [17.682803546212824]
本研究では,個人内における相対的な症状変化の軌跡を捉えるためのLIPT方式を提案する。
このフレームワークの中心は、縦長の音声記録を文脈対応の潜在表現に変換するシーケンスパーソナライズ(PSE)である。
225人のコホートによる実験の結果、LIPTパラダイムは古典的な横断的アプローチよりも優れていた。
論文 参考訳(メタデータ) (2026-02-23T10:19:17Z) - Towards Reliable Medical LLMs: Benchmarking and Enhancing Confidence Estimation of Large Language Models in Medical Consultation [97.36081721024728]
本稿では,現実的な医療相談におけるマルチターンインタラクションの信頼性を評価するための最初のベンチマークを提案する。
本ベンチマークでは,3種類の医療データを統合し,診断を行う。
本稿では,エビデンスを基盤とした言語自己評価フレームワークであるMedConfを紹介する。
論文 参考訳(メタデータ) (2026-01-22T04:51:39Z) - AgentEHR: Advancing Autonomous Clinical Decision-Making via Retrospective Summarization [28.032865974227875]
RetroSumは、レトロスペクティブの要約メカニズムと進化するエクスペリエンス戦略を統合するフレームワークである。
競争ベースラインよりも29.16%のパフォーマンス向上を実現し、全体のインタラクションエラーを92.3%まで大幅に削減した。
論文 参考訳(メタデータ) (2026-01-20T12:48:04Z) - WER is Unaware: Assessing How ASR Errors Distort Clinical Understanding in Patient Facing Dialogue [3.468314243424983]
ASR(Automatic Speech Recognition)は、臨床対話においてますます普及している。
標準評価は依然としてエラーエラー率(WER)に大きく依存している。
本稿では、WERや他の一般的な指標が転写誤りの臨床的影響と相関するかどうかを基準として検討する。
論文 参考訳(メタデータ) (2025-11-20T16:59:20Z) - HiRef: Leveraging Hierarchical Ontology and Network Refinement for Robust Medication Recommendation [17.45722229030237]
我々は、ロバストメディカルレコメンデーション(HiRef)のための階層的オントロジーとネットワークリファインメントを提案する。
我々は、自然に木のような関係を捉え、共有された祖先を通して知識の伝達を可能にする双曲空間に実体を埋め込む。
本モデルは,EMHベンチマーク(MIMIC-IIIおよびMIMIC-IV)において高い性能を達成し,シミュレーションできないコード設定下で高い精度を維持する。
論文 参考訳(メタデータ) (2025-08-14T07:55:03Z) - CTPD: Cross-Modal Temporal Pattern Discovery for Enhanced Multimodal Electronic Health Records Analysis [50.56875995511431]
マルチモーダルEHRデータから有意な時間的パターンを効率的に抽出するために,CTPD(Cross-Modal Temporal Pattern Discovery)フレームワークを導入する。
提案手法では,時間的セマンティックな埋め込みを生成するためにスロットアテンションを用いて改良された時間的パターン表現を提案する。
論文 参考訳(メタデータ) (2024-11-01T15:54:07Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - COMPOSE: Cross-Modal Pseudo-Siamese Network for Patient Trial Matching [70.08786840301435]
本稿では, CrOss-Modal PseudO-SiamEse Network (COMPOSE) を提案する。
実験の結果,患者基準マッチングでは98.0%,患者基準マッチングでは83.7%の精度でAUCに到達できることがわかった。
論文 参考訳(メタデータ) (2020-06-15T21:01:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。