論文の概要: Guideline-grounded retrieval-augmented generation for ophthalmic clinical decision support
- arxiv url: http://arxiv.org/abs/2603.21925v1
- Date: Mon, 23 Mar 2026 12:47:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.672392
- Title: Guideline-grounded retrieval-augmented generation for ophthalmic clinical decision support
- Title(参考訳): 眼科臨床診断支援のためのガイドラインに基づく検索強化
- Authors: Shuying Chen, Sen Cui, Zhong Cao,
- Abstract要約: Oph-Guid-RAGは眼科臨床質問応答と意思決定支援のためのマルチモーダルビジュアルRAGシステムである。
各ガイドラインページを独立したエビデンス単位として扱い、ページイメージを直接検索し、テーブル、フローチャート、レイアウト情報を保存する。
このシステムは、クエリ分解、クエリ書き換え、検索、再ランク付け、マルチモーダル推論を統合し、ガイドラインページ参照でトレース可能な出力を提供する。
- 参考スコア(独自算出の注目度): 8.709303749983818
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we propose Oph-Guid-RAG, a multimodal visual RAG system for ophthalmology clinical question answering and decision support. We treat each guideline page as an independent evidence unit and directly retrieve page images, preserving tables, flowcharts, and layout information. We further design a controllable retrieval framework with routing and filtering, which selectively introduces external evidence and reduces noise. The system integrates query decomposition, query rewriting, retrieval, reranking, and multimodal reasoning, and provides traceable outputs with guideline page references. We evaluate our method on HealthBench using a doctor-based scoring protocol. On the hard subset, our approach improves the overall score from 0.2969 to 0.3861 (+0.0892, +30.0%) compared to GPT-5.2, and achieves higher accuracy, improving from 0.5956 to 0.6576 (+0.0620, +10.4%). Compared to GPT-5.4, our method achieves a larger accuracy gain of +0.1289 (+24.4%). These results show that our method is more effective on challenging cases that require precise, evidence-based reasoning. Ablation studies further show that reranking, routing, and retrieval design are critical for stable performance, especially under difficult settings. Overall, we show how combining visionbased retrieval with controllable reasoning can improve evidence grounding and robustness in clinical AI applications,while pointing out that further work is needed to be more complete.
- Abstract(参考訳): 本稿では,眼科臨床質問応答と意思決定支援のための多モード視覚RAGシステムであるOph-Guid-RAGを提案する。
各ガイドラインページを独立したエビデンス単位として扱い、ページイメージを直接検索し、テーブル、フローチャート、レイアウト情報を保存する。
さらに、外部エビデンスを選択的に導入し、ノイズを低減する、ルーティングとフィルタリングによる制御可能な検索フレームワークを設計する。
このシステムは、クエリ分解、クエリ書き換え、検索、再ランク付け、マルチモーダル推論を統合し、ガイドラインページ参照でトレース可能な出力を提供する。
医師ベースのスコアリングプロトコルを用いてHealthBenchの手法を評価する。
ハードサブセットでは,GPT-5.2と比較して0.2969から0.3861(+0.0892,+30.0%)に改善し,0.5956から0.6576(+0.0620,+10.4%)に改善した。
GPT-5.4と比較すると, 精度は+0.1289 (+24.4%) である。
これらの結果から, 本手法は, 正確かつ証拠に基づく推論を必要とする課題に対して, より効果的であることが示唆された。
アブレーション研究により、特に困難な状況下では、再ランク付け、ルーティング、検索設計が安定した性能に不可欠であることが示されている。
全体として、視覚に基づく検索と制御可能な推論を組み合わせることで、臨床AI応用における根拠と堅牢性が向上し、さらなる作業がより完全である必要があることを指摘する。
関連論文リスト
- From Evidence-Based Medicine to Knowledge Graph: Retrieval-Augmented Generation for Sports Rehabilitation and a Domain Benchmark [12.595335483488052]
医学において、大規模な言語モデルは、最新の外部証拠のアウトプットを得るために、検索強化世代(RAG)にますます依存している。
本研究は,(1)クエリと検索されたエビデンス間のPICOアライメントの欠如,(2)再ランク付け時のエビデンス階層的考察の欠如,の2つの主要なギャップに対処する。
本稿では,知識グラフ構築と検索にPICOフレームワークを統合することにより,EMMをグラフベースRAGに適用するための一般化可能な戦略を提案する。
論文 参考訳(メタデータ) (2026-01-01T05:20:54Z) - A DeepSeek-Powered AI System for Automated Chest Radiograph Interpretation in Clinical Practice [83.11942224668127]
Janus-Pro-CXR (1B) はDeepSeek Janus-Proモデルに基づく胸部X線解釈システムである。
本システムは, 自動レポート生成において, 最先端のX線レポート生成モデルより優れる。
論文 参考訳(メタデータ) (2025-12-23T13:26:13Z) - Evolving Diagnostic Agents in a Virtual Clinical Environment [75.59389103511559]
本稿では,大規模言語モデル(LLM)を強化学習を用いた診断エージェントとして訓練するためのフレームワークを提案する。
本手法は対話型探索と結果に基づくフィードバックによって診断戦略を取得する。
DiagAgentはDeepSeek-v3やGPT-4oなど、最先端の10のLLMを著しく上回っている。
論文 参考訳(メタデータ) (2025-10-28T17:19:47Z) - EchoBench: Benchmarking Sycophancy in Medical Large Vision-Language Models [82.43729208063468]
医療用LVLM(Large Vision-Language Models)の最近のベンチマークでは、信頼性と安全性を見越して、リーダボードの精度を強調している。
ユーザが提供した情報を非批判的に反響させる傾向のモデルについて検討する。
医療用LVLMの梅毒を系統的に評価するベンチマークであるEchoBenchを紹介する。
論文 参考訳(メタデータ) (2025-09-24T14:09:55Z) - Evaluating Large Language Models for Evidence-Based Clinical Question Answering [4.101088122511548]
大規模言語モデル (LLMs) は, 医学的, 臨床的応用において著しく進歩している。
Cochraneの体系的レビューと臨床ガイドラインから得られたベンチマークをキュレートする。
我々はソースと臨床領域間で一貫したパフォーマンスパターンを観察する。
論文 参考訳(メタデータ) (2025-09-13T15:03:34Z) - ClipGS: Clippable Gaussian Splatting for Interactive Cinematic Visualization of Volumetric Medical Data [51.095474325541794]
医用データのインタラクティブなシネマティック可視化のためのクリッピングプレーンを備えた革新的なガウススプレイティングフレームワークであるClipGSを紹介した。
本手法を5つのボリューム医療データで検証し,平均36.635 PSNRレンダリング品質を156 FPS,16.1MBモデルサイズで達成した。
論文 参考訳(メタデータ) (2025-07-09T08:24:28Z) - Neural at ArchEHR-QA 2025: Agentic Prompt Optimization for Evidence-Grounded Clinical Question Answering [4.898784451149235]
今回我々は,BioNLP 2025 Arch-QA の準優勝者である Neural について紹介する。
提案手法は,(1)文章レベルのエビデンス同定と(2)明示的な引用による回答合成にタスクを分解する。
自己整合性投票方式は、精度を犠牲にすることなく証拠リコールをさらに改善する。
論文 参考訳(メタデータ) (2025-06-12T14:36:18Z) - Harnessing Foundation Models for Robust and Generalizable 6-DOF Bronchoscopy Localization [2.795503750654676]
視覚に基づく6-DOF気管支鏡の局所化は、正確で費用対効果の高い介入誘導のための有望なソリューションを提供する。
既存の方法では,1)ラベル付きデータ不足による患者全体の一般化の制限,2)視覚的劣化による堅牢性の低下に苦慮している。
気管支鏡の局所化フレームワークであるPANSv2を提案する。
論文 参考訳(メタデータ) (2025-05-30T06:14:12Z) - Revisiting Medical Image Retrieval via Knowledge Consolidation [46.6989555659494]
本稿では,階層的特徴と機能に関する知識を集約する新しい手法を提案する。
本稿では,Depth-aware Representation Fusion (DaRF)とStructure-aware Contrastive Hashing (SCH)を紹介する。
解剖学的放射線学データセットの平均精度は5.6~38.9%向上した。
論文 参考訳(メタデータ) (2025-03-12T13:16:42Z) - Systematic Clinical Evaluation of A Deep Learning Method for Medical
Image Segmentation: Radiosurgery Application [48.89674088331313]
3次元医用画像分割作業において,Deep Learning (DL) 手法を体系的に評価した。
本手法は放射線外科治療プロセスに統合され,臨床ワークフローに直接影響を及ぼす。
論文 参考訳(メタデータ) (2021-08-21T16:15:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。