論文の概要: EpiGraph: A Knowledge Graph and Benchmark for Evidence-Intensive Reasoning in Epilepsy
- arxiv url: http://arxiv.org/abs/2605.09505v1
- Date: Sun, 10 May 2026 12:27:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.285187
- Title: EpiGraph: A Knowledge Graph and Benchmark for Evidence-Intensive Reasoning in Epilepsy
- Title(参考訳): EpiGraph: てんかんにおけるエビデンス集約推論のための知識グラフとベンチマーク
- Authors: Yuyang Dai, Zheng Chen, Jathurshan Pradeepkumar, Yasuko Matsubara, Jimeng Sun, Yasushi Sakurai, Yushun Dong,
- Abstract要約: textscEpiGraphは、知識を付加した臨床推論を評価するための大規模なてんかんの知識グラフとベンチマークである。
textscEpiBenchは、臨床意思決定、脳波レポート生成、薬理ゲノム精度医学、治療勧告、深層研究計画の5つの臨床的動機付けタスクを定義している。
その結果、textscEpiGraphの統合は、すべてのタスクにおけるパフォーマンスを一貫して改善し、薬理学的推論で見られる最大の利益が得られている。
- 参考スコア(独自算出の注目度): 36.811344642747486
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Epilepsy diagnosis and treatment require evidence-intensive reasoning across heterogeneous clinical knowledge, including biosignal patterns, genetic mechanisms, pharmacogenomics, treatment strategies, and patient outcomes. In this work, we present \textsc{EpiGraph}, a large-scale epilepsy knowledge graph and benchmark for evaluating knowledge-augmented clinical reasoning. \textsc{EpiGraph} integrates 48,166 peer-reviewed papers and seven clinical resources into a heterogeneous graph containing 24,324 entities and 32,009 evidence-grounded triplets across five clinical layers. Built upon this graph, \textsc{EpiBench} defines five clinically motivated tasks spanning clinical decision-making, EEG report generation, pharmacogenomic precision medicine, treatment recommendation, and deep research planning. We evaluate six LLMs under both standard and Graph-RAG settings. Results show that integrating \textsc{EpiGraph} consistently improves performance across all tasks, with the largest gains observed in pharmacogenomic reasoning (+30--41\%). Our findings demonstrate that structured epilepsy knowledge substantially enhances evidence-grounded clinical reasoning and provides a practical benchmark framework for evaluating knowledge-augmented LLMs in real-world neurological settings. Our code is available at: https://github.com/LabRAI/EEG-KG.
- Abstract(参考訳): てんかんの診断と治療には、生体信号パターン、遺伝子機構、薬理ゲノミクス、治療戦略、患者結果などを含む、異種の臨床知識にわたるエビデンス集約的な推論が必要である。
本研究では,大規模てんかん知識グラフであるtextsc{EpiGraph} を,知識を付加した臨床推論を評価するためのベンチマークとして提示する。
textsc{EpiGraph} は、48,166のピアレビュー論文と7つの臨床リソースを、24,324のエンティティと32,009のエビデンスグラウンド三つ子を含む不均一なグラフに統合する。
このグラフの上に構築された『textsc{EpiBench}』は、臨床意思決定、脳波レポート生成、薬理ゲノム精度医学、治療勧告、深層研究計画にまたがる5つの臨床的動機付けタスクを定義している。
標準設定とグラフRAG設定の両方で6つのLLMを評価した。
以上の結果から,textsc{EpiGraph} の統合は,薬理学的推論(+30~-41\%)において,すべてのタスクにおけるパフォーマンスを継続的に向上することが示された。
本研究は, 構造化てんかん知識が, 根拠に基づく臨床推論を著しく促進し, 実世界の神経学的設定において, 知識増強LSMを評価するための実践的ベンチマーク・フレームワークを提供することを示した。
私たちのコードは、https://github.com/LabRAI/EEG-KG.comで利用可能です。
関連論文リスト
- Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - MED-COPILOT: A Medical Assistant Powered by GraphRAG and Similar Patient Case Retrieval [12.265116154395434]
MED-COPILOTは,臨床医と研修医を対象としたインタラクティブな臨床意思決定支援システムである。
このシステムはWHOとNICEのガイドラインから構造化知識グラフを構築し、効率的な検索にコミュニティレベルの要約を適用し、36,000ケースの類似患者データベースを維持している。
論文 参考訳(メタデータ) (2026-02-28T04:32:03Z) - Omni-iEEG: A Large-Scale, Comprehensive iEEG Dataset and Benchmark for Epilepsy Research [4.4167069169736655]
$textbf Omni-iEEG は $textbf302 患者$と $textbf178 時間高解像度記録を含む大規模で手術前の iEEG リソースである。
発作性発症ゾーン、切除、手術結果などの調和した臨床メタデータが含まれており、診断されたてんかん医によって検証されている。
臨床的に意味のあるタスクを定義し、臨床に関係のある環境でモデルの体系的な評価を可能にする。
論文 参考訳(メタデータ) (2026-02-17T22:55:11Z) - Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:19:47Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - SemioLLM: Evaluating Large Language Models for Diagnostic Reasoning from Unstructured Clinical Narratives in Epilepsy [45.2233252981348]
臨床知識を符号化するための言語モデル(LLM)が示されている。
6つの最先端モデルをベンチマークする評価フレームワークであるSemioLLMを提案する。
ほとんどのLSMは、脳内の発作発生領域の確率的予測を正確かつ確実に生成できることを示す。
論文 参考訳(メタデータ) (2024-07-03T11:02:12Z) - Knowledge Graph Representations to enhance Intensive Care Time-Series
Predictions [4.660203987415476]
提案手法は,ICUデータと医療知識を統合し,臨床意思決定モデルを改善する。
グラフ表現とバイタルサインと臨床報告を組み合わせることで、パフォーマンスを向上させる。
我々のモデルには、知識グラフノードが予測にどのように影響するかを理解するための解釈可能性コンポーネントが含まれています。
論文 参考訳(メタデータ) (2023-11-13T09:11:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。