論文の概要: HealthNLP_Retrievers at ArchEHR-QA 2026: Cascaded LLM Pipeline for Grounded Clinical Question Answering
- arxiv url: http://arxiv.org/abs/2604.26880v1
- Date: Wed, 29 Apr 2026 16:47:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.49881
- Title: HealthNLP_Retrievers at ArchEHR-QA 2026: Cascaded LLM Pipeline for Grounded Clinical Question Answering
- Title(参考訳): 健康NLP_Retrievers at ArchEHR-QA 2026: Cascaded LLM Pipelines for Grounded Clinical Question Answering
- Authors: Md Biplob Hosen, Md Alomgeer Hussein, Md Akmol Masud, Omar Faruque, Tera L Reynolds, Lujie Karen Chen,
- Abstract要約: 本稿では,HealthNLP_Retrieversチームが開発したシステムについて述べる。
提案手法では,Gemini 2.5 Proの大規模言語モデルを利用した多段階カスケードパイプラインを使用する。
本アーキテクチャは,(1)患者問合せを要約する数発の問合せ修正ユニット,(2)臨床文章をリコールする動詞ベースのエビデンススコアラ,(3)専門職の回答を合成する接地応答生成器の4つの統合モジュールから構成される。
- 参考スコア(独自算出の注目度): 4.835744579415159
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Patient portals now give individuals direct access to their electronic health records (EHRs), yet access alone does not ensure patients understand or act on the complex clinical information contained in these records. The ArchEHR-QA 2026 shared task addresses this challenge by focusing on grounded question answering over EHRs, and this paper presents the system developed by the HealthNLP_Retrievers team for this task. The proposed approach uses a multi-stage cascaded pipeline powered by the Gemini 2.5 Pro large language model to interpret patient-authored questions and retrieve relevant evidence from lengthy clinical notes. Our architecture comprises four integrated modules: (1) a few-shot query reformulation unit which summarizes verbose patient queries; (2) a heuristic-based evidence scorer which ranks clinical sentences to prioritize recall; (3) a grounded response generator which synthesizes professional-caliber answers restricted strictly to identified evidence; and (4) a high-precision many-to-many alignment framework which links generated answers to supporting clinical sentences. This cascaded approach achieved competitive results. Across the individual tracks, the system ranked 1st in question interpretation, 5th in answer generation, 7th in evidence identification, and 9th in answer-evidence alignment. These results show that integrating large language models within a structured multi-stage pipeline improves grounding, precision, and the professional quality of patient-oriented health communication. To support reproducibility, our source code is publicly available in our GitHub repository
- Abstract(参考訳): 患者ポータルは、個人が電子的健康記録(EHR)に直接アクセスできるようになっているが、患者がこれらの記録に含まれる複雑な臨床情報を理解したり、行動したりすることはない。
ArchEHR-QA 2026 では,EHR 上での根拠付き質問応答に着目し,この課題に対処するタスクを共有し,このタスクのためにHealthNLP_Retrievers チームが開発したシステムを提案する。
提案手法は,Gemini 2.5 Pro大言語モデルを用いた多段階カスケードパイプラインを用いて,患者が承認した質問を解釈し,関連する証拠を長期臨床ノートから取得する。
本アーキテクチャは,(1)患者問合せを要約する数発の問合せ再構築ユニット,(2)臨床文章を優先順位付けするヒューリスティックなエビデンススコアラ,(3)専門的・専門的な回答を厳密に合成するグラウンドド応答生成器,(4)臨床文章を補完する高精度な多対多アライメントフレームワーク,の4つの統合モジュールから構成される。
このカジュアルなアプローチは競争力のある結果を得た。
個々のトラック全体では、質問文の解釈では第1位、回答生成では第5位、証拠の確認では第7位、回答・証拠のアライメントでは第9位にランクインした。
これらの結果から, 構造化多段階パイプラインにおける大規模言語モデルの統合により, 患者指向の健康コミュニケーションの基盤, 精度, 品質が向上することが示唆された。
再現性をサポートするため、ソースコードはGitHubリポジトリで公開されています。
関連論文リスト
- Unlocking Electronic Health Records: A Hybrid Graph RAG Approach to Safe Clinical AI for Patient QA [1.9615061725959186]
大規模言語モデルは、データ処理の変換可能性を提供するが、臨床環境では制限に直面している。
現在のソリューションは通常、構造化データ(Text2Cypher)や非構造化セマンティックサーチに焦点を当てた検索方法を分離するが、両方を同時に統合することができない。
この研究は、このギャップを埋める新しいハイブリッドグラフRAGシステムであるMediGRAFを提示する。
論文 参考訳(メタデータ) (2025-11-27T16:08:22Z) - From EMR Data to Clinical Insight: An LLM-Driven Framework for Automated Pre-Consultation Questionnaire Generation [9.269061009613033]
複雑な電子カルテ(EMR)から事前コンサルテーションアンケートを作成するための新しい枠組みを提案する。
この枠組みは、明確な臨床知識を構築することによって直接的手法の限界を克服する。
実世界のEMRデータセットを用いて評価し,臨床専門家が検証し,情報カバレッジ,診断関連性,理解可能性,生成時間に優れた性能を示す。
論文 参考訳(メタデータ) (2025-08-01T12:24:49Z) - Neural at ArchEHR-QA 2025: Agentic Prompt Optimization for Evidence-Grounded Clinical Question Answering [4.898784451149235]
今回我々は,BioNLP 2025 Arch-QA の準優勝者である Neural について紹介する。
提案手法は,(1)文章レベルのエビデンス同定と(2)明示的な引用による回答合成にタスクを分解する。
自己整合性投票方式は、精度を犠牲にすることなく証拠リコールをさらに改善する。
論文 参考訳(メタデータ) (2025-06-12T14:36:18Z) - A Dataset for Addressing Patient's Information Needs related to Clinical Course of Hospitalization [15.837772594006038]
ArchEHR-QAは、集中治療室と救急部門の設定から現実の患者をベースとした、専門家による注釈付きデータセットである。
症例は、公衆衛生フォーラムへの患者による質問、臨床医が解釈した質問、関連する臨床ノートの抜粋、および臨床医が認可した回答である。
答えファーストのプロンプトアプローチは一貫して最善を尽くし、ラマ4は最高得点を獲得した。
論文 参考訳(メタデータ) (2025-06-04T16:55:08Z) - Structured Outputs Enable General-Purpose LLMs to be Medical Experts [50.02627258858336]
大規模言語モデル(LLM)は、しばしばオープンエンドの医学的問題に苦しむ。
本稿では,構造化医療推論を利用した新しいアプローチを提案する。
我々の手法は85.8のファクチュアリティスコアを達成し、微調整されたモデルを上回る。
論文 参考訳(メタデータ) (2025-03-05T05:24:55Z) - Give me Some Hard Questions: Synthetic Data Generation for Clinical QA [13.436187152293515]
本稿では,ゼロショット環境での大規模言語モデル(LLM)を用いた臨床QAデータの生成について検討する。
ナイーブなプロンプトが臨床シナリオの複雑さを反映しない簡単な質問をもたらすことがよくあります。
2つの臨床QAデータセットを用いた実験により,本手法はより難解な質問を発生し,ベースライン上での微調整性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-12-05T19:35:41Z) - RECAP-KG: Mining Knowledge Graphs from Raw GP Notes for Remote COVID-19
Assessment in Primary Care [45.43645878061283]
本稿では,患者相談の前後に書かれた生のGP医療ノートから知識グラフ構築を行うフレームワークを提案する。
私たちの知識グラフには、既存の患者の症状、その持続時間、重症度に関する情報が含まれています。
本フレームワークを英国における新型コロナウイルス患者の相談ノートに適用する。
論文 参考訳(メタデータ) (2023-06-17T23:35:51Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Interpretable Multi-Step Reasoning with Knowledge Extraction on Complex
Healthcare Question Answering [89.76059961309453]
HeadQAデータセットには、公衆医療専門試験で認可された複数の選択質問が含まれている。
これらの質問は、現在のQAシステムにとって最も難しいものです。
知識抽出フレームワーク(MurKe)を用いた多段階推論を提案する。
市販の事前訓練モデルを完全に活用しようと努力しています。
論文 参考訳(メタデータ) (2020-08-06T02:47:46Z) - Learning Contextualized Document Representations for Healthcare Answer
Retrieval [68.02029435111193]
コンテキスト談話ベクトル(英: Contextual Discourse Vectors、CDV)は、長文からの効率的な回答検索のための分散文書表現である。
本モデルでは,階層型LSTMレイヤとマルチタスクトレーニングを併用したデュアルエンコーダアーキテクチャを用いて,臨床エンティティの位置と文書の談話に沿った側面をエンコードする。
我々の一般化モデルは、医療パスランキングにおいて、最先端のベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2020-02-03T15:47:19Z) - DeepEnroll: Patient-Trial Matching with Deep Embedding and Entailment
Prediction [67.91606509226132]
臨床試験は医薬品開発に不可欠であるが、高価で不正確で不十分な患者募集に苦しむことが多い。
DeepEnrollは、入力基準(タブラリデータ)を一致する推論のための共有潜在空間に共同でエンコードする、クロスモーダル推論学習モデルである。
論文 参考訳(メタデータ) (2020-01-22T17:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。