論文の概要: Towards Error-Free EHRs: Reasoning-Intensive Consistency Verification Between Clinical Notes and Structured Tables in Electronic Health Records
- arxiv url: http://arxiv.org/abs/2605.26463v1
- Date: Tue, 26 May 2026 02:19:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.578989
- Title: Towards Error-Free EHRs: Reasoning-Intensive Consistency Verification Between Clinical Notes and Structured Tables in Electronic Health Records
- Title(参考訳): エラーフリー EHR に向けて:電子健康記録における臨床ノートと構造化表の一致性検証
- Authors: Yeonsu Kwon, Jiho Kim, Junseong Choi, Paloma Rabaey, Minseo Kim, Sujeong Im, Jeewon Yang, Jun-Min Lee, Sangji Lee, Jiwon Kim, Hangyul Yoon, Hyunwook Kwon, Edward Choi,
- Abstract要約: EHR-ReasonConは、ノートテーブル整合性検証のための推論集約型ベンチマークである。
また,音符をセグメント化し,アンカーエンティティと時間参照を抽出するELH-Inspectorを提案し,テーブル探索ツールを用いて構造化テーブルに対する整合性を検証する。
- 参考スコア(独自算出の注目度): 19.696931844348814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data consistency between unstructured clinical notes and structured tables in Electronic Health Records (EHRs) is essential for patient safety and clinical decision-making. However, existing work on note-table consistency verification mainly relies on surface-level matching of numeric values or simple events. Such approaches fail to capture the reasoning underlying real-world EHR documentation, including clinical interpretation, event relations, and temporal changes. To address this gap, we introduce EHR-ReasonCon, a reasoning-intensive benchmark for note-table consistency verification. Built on MIMIC-III with expert-guided annotations, it comprises 8,048 entities derived from clinical notes and provides high-quality ground-truth labels. The annotation protocol is supported by specialized table-exploration tools to ensure systematic evidence retrieval and reliable consistency assessment. We also propose EHR-Inspector, an LLM-based framework that segments notes, extracts anchor entities and temporal references, and uses table-exploration tools to verify consistency against structured tables. Evaluated using expert-validated LLM-as-a-judge metrics under harsh and lenient criteria, EHR-Inspector achieves state-of-the-art performance across multiple model backbones. Analyses further demonstrate the effectiveness of its components and highlight differences from human verification.
- Abstract(参考訳): エレクトロニック・ヘルス・レコーズ(EHR)における非構造的臨床ノートと構造化表とのデータの整合性は、患者の安全と臨床的意思決定に不可欠である。
しかし、ノートテーブルの整合性検証に関する既存の研究は、主に数値や単純な事象の表面レベルのマッチングに依存している。
このようなアプローチは、臨床解釈、事象の関係、時間的変化など、現実の EHR 文書の根拠となる推論を捉えるのに失敗する。
このギャップに対処するために、注記表整合性検証のための推論集約型ベンチマークであるEHR-ReasonConを導入する。
MIMIC-IIIに専門家が指導するアノテーションを組み、臨床ノートから8,048個のエンティティを抽出し、高品質な地下構造ラベルを提供する。
アノテーションプロトコルは、システマティックエビデンス検索と信頼性の高い一貫性アセスメントを保証するための特別なテーブル探索ツールによってサポートされている。
また,音符をセグメント化し,アンカーエンティティと時間参照を抽出するELH-Inspectorを提案し,テーブル探索ツールを用いて構造化テーブルに対する整合性を検証する。
EHR-Inspectorは、厳密で寛大な基準の下で専門家によるLCM-as-a-judgeメトリクスを用いて評価し、複数のモデルバックボーンにわたる最先端のパフォーマンスを達成する。
分析は、その構成要素の有効性をさらに示し、人間の検証との違いを強調している。
関連論文リスト
- WISTERIA: Learning Clinical Representations from Noisy Supervision via Multi-View Consistency in Electronic Health Records [1.585843510099207]
WISTERIAは弱教師付き表現学習フレームワークである。
誘導されたラベル分布の一貫性を強制することで表現を学習する。
標準のEHRベンチマークで予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2026-05-10T21:25:41Z) - Systematic Evaluation of Large Language Models for Post-Discharge Clinical Action Extraction [0.0]
本稿では,CLIP分泌ノートデータセットを用いた安全クリティカルな臨床行動抽出のためのゼロショットおよび少数ショット大言語モデル (LLMs) について検討する。
そこで本稿では,物語形式で記述された2段階の退院記譜を,よりきめ細やかに動作可能な臨床タスクに分解する2段階の抽出フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-07T13:05:07Z) - CT-FineBench: A Diagnostic Fidelity Benchmark for Fine-Grained Evaluation of CT Report Generation [51.11942945171396]
従来の評価指標は、語彙重なり合いやエンティティマッチングの粗い尺度のみを提供する。
我々はCT-RATEとMerlinのベンチマークであるCT-FineBenchを提案し、CTレポートの微細な事実整合性を評価する。
我々のベンチマークは、綿密な質問回答(QA)ベースのプロセスによって構築されます。
論文 参考訳(メタデータ) (2026-04-27T03:32:46Z) - AgenticSum: An Agentic Inference-Time Framework for Faithful Clinical Text Summarization [6.99563009617414]
本稿では, 文脈選択, 生成, 検証, 対象訂正を分離し, 幻覚的内容を減らすための推論時フレームワークであるAgenticSumを提案する。
我々は,2つの公開データセット上で,基準ベースメトリクス,LCM-as-a-judgeアセスメント,人的評価を用いてエージェントサムを評価する。
以上の結果から, 目標修正を施した構造的エージェント設計は, 臨床メモの要約を改善するための効果的な推測時間解を提供することが明らかとなった。
論文 参考訳(メタデータ) (2026-02-23T16:49:37Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - RaTEScore: A Metric for Radiology Report Generation [59.37561810438641]
本稿では,Radiological Report (Text) Evaluation (RaTEScore) として,新しい実体認識尺度を提案する。
RaTEScoreは、診断結果や解剖学的詳細などの重要な医療機関を強調し、複雑な医学的同義語に対して堅牢であり、否定表現に敏感である。
我々の評価は、RaTEScoreが既存の指標よりも人間の嗜好とより密接に一致していることを示し、確立された公開ベンチマークと、新たに提案したRaTE-Evalベンチマークの両方で検証した。
論文 参考訳(メタデータ) (2024-06-24T17:49:28Z) - EHRCon: Dataset for Checking Consistency between Unstructured Notes and Structured Tables in Electronic Health Records [14.69982800306006]
EHRは、構造化されたデータ(例えば、医薬品)と詳細な臨床ノート(例えば、医師注記)を組み合わせることで、包括的な患者の医療記録を保存するのに不可欠なものである。
これらの要素は、簡単なデータ検索に不可欠であり、患者のケアに対する深い文脈的な洞察を提供する。
しかし、直感的なEHRシステム設計とヒューマンエラーにより、しばしば不一致に悩まされる。
EHRにおける構造化テーブルと非構造化ノート間のデータの一貫性を確保するために設計された新しいデータセットとタスクであるEHRConを開発した。
論文 参考訳(メタデータ) (2024-06-24T06:26:50Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。