論文の概要: Unlocking Electronic Health Records: A Hybrid Graph RAG Approach to Safe Clinical AI for Patient QA
- arxiv url: http://arxiv.org/abs/2602.00009v1
- Date: Thu, 27 Nov 2025 16:08:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 02:03:42.181347
- Title: Unlocking Electronic Health Records: A Hybrid Graph RAG Approach to Safe Clinical AI for Patient QA
- Title(参考訳): 電子健康記録のアンロック:患者QAのための安全な臨床AIのためのハイブリッドグラフRAGアプローチ
- Authors: Samuel Thio, Matthew Lewis, Spiros Denaxas, Richard JB Dobson,
- Abstract要約: 大規模言語モデルは、データ処理の変換可能性を提供するが、臨床環境では制限に直面している。
現在のソリューションは通常、構造化データ(Text2Cypher)や非構造化セマンティックサーチに焦点を当てた検索方法を分離するが、両方を同時に統合することができない。
この研究は、このギャップを埋める新しいハイブリッドグラフRAGシステムであるMediGRAFを提示する。
- 参考スコア(独自算出の注目度): 1.9615061725959186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic health record (EHR) systems present clinicians with vast repositories of clinical information, creating a significant cognitive burden where critical details are easily overlooked. While Large Language Models (LLMs) offer transformative potential for data processing, they face significant limitations in clinical settings, particularly regarding context grounding and hallucinations. Current solutions typically isolate retrieval methods focusing either on structured data (SQL/Cypher) or unstructured semantic search but fail to integrate both simultaneously. This work presents MediGRAF (Medical Graph Retrieval Augmented Framework), a novel hybrid Graph RAG system that bridges this gap. By uniquely combining Neo4j Text2Cypher capabilities for structured relationship traversal with vector embeddings for unstructured narrative retrieval, MediGRAF enables natural language querying of the complete patient journey. Using 10 patients from the MIMIC-IV dataset (generating 5,973 nodes and 5,963 relationships), we generated enough nodes and data for patient level question answering (QA), and we evaluated this architecture across varying query complexities. The system demonstrated 100\% recall for factual queries which means all relevant information was retrieved and in the output, while complex inference tasks achieved a mean expert quality score of 4.25/5 with zero safety violations. These results demonstrate that hybrid graph-grounding significantly advances clinical information retrieval, offering a safer, more comprehensive alternative to standard LLM deployments.
- Abstract(参考訳): 電子健康記録(EHR)システムでは、臨床情報の膨大なリポジトリを持つ臨床医を提示し、重要な詳細が容易に見落とされてしまう重要な認知的負担を生じさせる。
LLM(Large Language Models)は、データ処理にトランスフォーメーションの可能性をもっているが、特にコンテキストグラウンドや幻覚に関して、臨床設定において重大な制限に直面している。
現在のソリューションは通常、構造化データ(SQL/Cypher)や非構造化セマンティックサーチに焦点を当てた検索手法を分離するが、両方を同時に統合することができない。
この研究は、このギャップを埋める新しいハイブリッドグラフRAGシステムであるMediGRAF(Medical Graph Retrieval Augmented Framework)を提示する。
構造化された関係トラバースのためのNeo4j Text2Cypher機能と、構造化されていない物語検索のためのベクトル埋め込みを一意に組み合わせることで、MediGRAFは、完全な患者旅行の自然言語クエリを可能にする。
MIMIC-IVデータセット(5,973ノード,5,963リレーションシップ)から10名の患者を用いて,患者レベル質問応答(QA)のための十分なノードとデータを生成し,クエリの複雑さを多岐にわたって評価した。
システムは、事実クエリに対する100\%のリコールを示し、これはすべての関連情報が検索され出力されることを意味し、一方、複雑な推論タスクは、安全違反がゼロの4.25/5の平均的な専門家品質スコアを達成した。
これらの結果から, ハイブリッドグラフグラウンドは臨床情報検索を著しく向上させ, より安全で包括的, 標準LCMの代替手段となることが示唆された。
関連論文リスト
- A Federated and Parameter-Efficient Framework for Large Language Model Training in Medicine [59.78991974851707]
大規模言語モデル(LLM)は、質問応答や診断など、医療ベンチマークにおいて強力なパフォーマンスを示している。
ほとんどの医療用LDMは、異種システムの一般化性と安全性の制限に直面している単一の機関のデータに基づいて訓練されている。
本稿では, LLMを医療応用に適用するためのモデルに依存しない, パラメータ効率のよいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-29T18:48:21Z) - Patient-level Information Extraction by Consistent Integration of Textual and Tabular Evidence with Bayesian Networks [4.993537302467224]
本稿では,専門家インフォームドベイズネットワークを用いたマルチモーダル患者レベルの情報抽出手法を提案する。
本稿では,モデルの予測を解釈可能かつ確率的に融合させるために,一貫性ノードを付加した仮想エビデンスを提案する。
提案手法の有効性をSimSUMデータセットに示す。
論文 参考訳(メタデータ) (2025-11-21T08:59:42Z) - OIDA-QA: A Multimodal Benchmark for Analyzing the Opioid Industry Documents Archive [50.468138755368805]
オピオイド危機は公衆衛生にとって重要な瞬間である。
UCSF-JHU Opioid Industry Documents Archive(OIDA)に公開されているデータと文書
本稿では,文書属性に応じて元のデータセットを整理することで,この問題に対処する。
論文 参考訳(メタデータ) (2025-11-13T03:27:32Z) - HealthBranches: Synthesizing Clinically-Grounded Question Answering Datasets via Decision Pathways [12.855316833585908]
HealthBranchesは、医療質問回答(Q&A)のための新しいベンチマークデータセット
このデータセットは半自動パイプラインを通じて生成され、医療ソースから関連する質問や回答を持つ現実的な患者に明確な決定経路を変換する。
17の医療トピックにわたる4,063のケーススタディをカバーし、各データポイントは臨床的に検証された推論チェーンに基づいています。
論文 参考訳(メタデータ) (2025-08-10T11:45:34Z) - HySemRAG: A Hybrid Semantic Retrieval-Augmented Generation Framework for Automated Literature Synthesis and Methodological Gap Analysis [55.2480439325792]
HySemRAGは、Extract, Transform, Load (ETL)パイプラインとRetrieval-Augmented Generation (RAG)を組み合わせたフレームワークである。
システムは、マルチ層アプローチを通じて既存のRAGアーキテクチャの制限に対処する。
論文 参考訳(メタデータ) (2025-08-01T20:30:42Z) - Give me Some Hard Questions: Synthetic Data Generation for Clinical QA [13.436187152293515]
本稿では,ゼロショット環境での大規模言語モデル(LLM)を用いた臨床QAデータの生成について検討する。
ナイーブなプロンプトが臨床シナリオの複雑さを反映しない簡単な質問をもたらすことがよくあります。
2つの臨床QAデータセットを用いた実験により,本手法はより難解な質問を発生し,ベースライン上での微調整性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-12-05T19:35:41Z) - Enhanced Electronic Health Records Text Summarization Using Large Language Models [0.0]
このプロジェクトは、臨床が優先する、焦点を絞った要約を生成するシステムを作成することで、以前の作業の上に構築される。
提案システムでは,Flan-T5モデルを用いて,臨床専門のトピックに基づいた調整されたERHサマリーを生成する。
論文 参考訳(メタデータ) (2024-10-12T19:36:41Z) - emrQA-msquad: A Medical Dataset Structured with the SQuAD V2.0 Framework, Enriched with emrQA Medical Information [2.2083091880368855]
emrQA-msquadデータセットは、医学用語の複雑さに対処するために開発された。
Span抽出タスク専用の医療データセットが導入され、システムの堅牢性が強化された。
BERT、RoBERTa、Tiny RoBERTaといったモデルの微調整により、F1スコアの範囲での応答精度は0.75から1.00に向上した。
論文 参考訳(メタデータ) (2024-04-18T10:06:00Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。