論文の概要: A Systematic Study of Retrieval Pipeline Design for Retrieval-Augmented Medical Question Answering
- arxiv url: http://arxiv.org/abs/2604.07274v1
- Date: Wed, 08 Apr 2026 16:37:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.640089
- Title: A Systematic Study of Retrieval Pipeline Design for Retrieval-Augmented Medical Question Answering
- Title(参考訳): 検索型医療質問応答のための検索パイプライン設計に関する体系的研究
- Authors: Nusrat Sultana, Abdullah Muhammad Moosa, Kazi Afzalur Rahman, Sajal Chandra Banik,
- Abstract要約: 大規模言語モデル(LLM)は、医学的質問応答において強力な能力を示している。
Retrieval-augmented Generation (RAG)は、外部知識検索を推論プロセスに統合することで、この制限に対処する。
本研究は、MedQA USMLEベンチマークと構造化教科書ベースの知識コーパスを用いて、RAGに基づく医療質問応答の体系的評価を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have demonstrated strong capabilities in medical question answering; however, purely parametric models often suffer from knowledge gaps and limited factual grounding. Retrieval-augmented generation (RAG) addresses this limitation by integrating external knowledge retrieval into the reasoning process. Despite increasing interest in RAG-based medical systems, the impact of individual retrieval components on performance remains insufficiently understood. This study presents a systematic evaluation of retrieval-augmented medical question answering using the MedQA USMLE benchmark and a structured textbook-based knowledge corpus. We analyze the interaction between language models, embedding models, retrieval strategies, query reformulation, and cross-encoder reranking within a unified experimental framework comprising forty configurations. Results show that retrieval augmentation significantly improves zero-shot medical question answering performance. The best-performing configuration was dense retrieval with query reformulation and reranking achieved 60.49% accuracy. Domain-specialized language models were also found to better utilize retrieved medical evidence than general-purpose models. The analysis further reveals a clear tradeoff between retrieval effectiveness and computational cost, with simpler dense retrieval configurations providing strong performance while maintaining higher throughput. All experiments were conducted on a single consumer-grade GPU, demonstrating that systematic evaluation of retrieval-augmented medical QA systems can be performed under modest computational resources.
- Abstract(参考訳): 大規模言語モデル(LLM)は、医学的質問応答において強力な能力を示しているが、純粋にパラメトリックモデルは知識ギャップと限られた事実的根拠に悩まされることが多い。
Retrieval-augmented Generation (RAG)は、外部知識検索を推論プロセスに統合することで、この制限に対処する。
RAGベースの医療システムへの関心が高まっているにもかかわらず、個々の検索要素がパフォーマンスに与える影響は十分に理解されていない。
本研究は,MedQA USMLEベンチマークと構造化教科書ベースの知識コーパスを用いて,検索強化医療質問応答の体系的評価を行う。
我々は, 言語モデル, 埋め込みモデル, 検索戦略, クエリ再構成, クロスエンコーダ間の相互作用を, フォーティ構成からなる統一実験フレームワーク内で再配置する。
その結果,検索の強化はゼロショット医療質問応答性能を著しく向上させることがわかった。
最も優れた構成は、クエリの改定による厳密な検索であり、60.49%の精度を達成した。
ドメイン特化言語モデルもまた、汎用モデルよりも検索された医学的証拠をより有効に活用することが判明した。
この分析により,高いスループットを維持しつつ高い性能を実現するため,検索効率と計算コストの明確なトレードオフが明らかになった。
すべての実験は、単一のコンシューマグレードのGPU上で行われ、検索強化医療QAシステムの体系的評価は、控えめな計算資源の下で行うことができることを示した。
関連論文リスト
- Proactive Reasoning-with-Retrieval Framework for Medical Multimodal Large Language Models [15.530083855947987]
我々は,Med-RwR を用いた最初のマルチモーダル医療推論フレームワークを提案する。
Med-RwRは、推論中に観察された症状やドメイン固有の医療概念を問い合わせることで、外部知識を積極的に回収する。
様々な公開医療ベンチマークの評価は、Med-RwRのベースラインモデルに対する大幅な改善を示している。
論文 参考訳(メタデータ) (2025-10-21T05:18:18Z) - RAR$^2$: Retrieval-Augmented Medical Reasoning via Thought-Driven Retrieval [25.425621641226815]
大きな言語モデル(LLM)は、様々な医療ベンチマークで有望なパフォーマンスを示している。
RAGは、外部医療情報を取り入れることで、知識ギャップと幻覚を緩和するための重要なアプローチとして登場した。
我々は、Reasoning-Augmented RetrievalとRetrieval-Augmented Reasoningを改善する共同学習フレームワークであるRAR$2$を提案する。
論文 参考訳(メタデータ) (2025-09-24T05:35:57Z) - Biomedical Literature Q&A System Using Retrieval-Augmented Generation (RAG) [0.0]
本報告では, バイオメディカル文献質問応答システム(Q&A)について述べる。
このシステムは、PubMedの記事、キュレートされたQ&Aデータセット、医療百科事典など、さまざまなソースを統合している。
このシステムは一般の医療クエリとドメイン固有のタスクの両方をサポートし、乳がんの文献に焦点を絞った評価を行う。
論文 参考訳(メタデータ) (2025-09-05T21:29:52Z) - End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.12425911708585]
Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-21T17:42:47Z) - Medical Reasoning in the Era of LLMs: A Systematic Review of Enhancement Techniques and Applications [59.721265428780946]
医学における大きな言語モデル(LLM)は印象的な能力を実現しているが、体系的で透明で検証可能な推論を行う能力に重大なギャップが残っている。
本稿は、この新興分野に関する最初の体系的なレビューを提供する。
本稿では,学習時間戦略とテスト時間メカニズムに分類した推論強化手法の分類法を提案する。
論文 参考訳(メタデータ) (2025-08-01T14:41:31Z) - Optimizing Retrieval-Augmented Generation of Medical Content for Spaced Repetition Learning [0.46603287532620746]
本稿では,ポーランド国家検索試験(PES)にコメント生成を用いたパイプラインを提案する。
このシステムは、これらの生成されたコメントとソース文書を空間的反復学習アルゴリズムと統合し、知識保持を強化する。
医用アノテータによる厳密な評価は、文書の妥当性、信頼性、生成したコンテンツの論理的一貫性などの重要な指標の改善を示す。
論文 参考訳(メタデータ) (2025-02-23T20:56:31Z) - Knowledge Graph-Driven Retrieval-Augmented Generation: Integrating Deepseek-R1 with Weaviate for Advanced Chatbot Applications [45.935798913942904]
構造化バイオメディカル知識と大規模言語モデル(LLM)を組み合わせた革新的なフレームワークを提案する。
本システムでは,年齢関連黄斑変性(AMD)に関する医学的要約から因果関係を同定・精査し,詳細な知識グラフを作成する。
ベクトルベース検索と局所展開言語モデルを用いて,臨床証拠を直接参照して,文脈的に関連性があり,検証可能な応答を生成する。
論文 参考訳(メタデータ) (2025-02-16T12:52:28Z) - Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering [70.44269982045415]
Retrieval-augmented Generation (RAG) は,大規模言語モデル (LLM) の性能向上のための有望なアプローチとして登場した。
医療用QAデータセットに様々な補助的要素を提供するMedRGB(MedRGB)を導入する。
実験結果から,検索した文書のノイズや誤情報の処理能力に限界があることが判明した。
論文 参考訳(メタデータ) (2024-11-14T06:19:18Z) - SeRTS: Self-Rewarding Tree Search for Biomedical Retrieval-Augmented Generation [50.26966969163348]
大規模言語モデル(LLM)は,検索増強世代(RAG)の進展に伴い,生物医学領域において大きな可能性を示した。
既存の検索強化アプローチは、様々なクエリやドキュメント、特に医療知識クエリに対処する上で、課題に直面している。
モンテカルロ木探索(MCTS)と自己回帰パラダイムに基づく自己回帰木探索(SeRTS)を提案する。
論文 参考訳(メタデータ) (2024-06-17T06:48:31Z) - CorpusBrain: Pre-train a Generative Retrieval Model for
Knowledge-Intensive Language Tasks [62.22920673080208]
単一ステップ生成モデルは、検索プロセスを劇的に単純化し、エンドツーエンドで最適化することができる。
我々は、事前学習された生成検索モデルをCorpsBrainと名付け、コーパスに関する全ての情報が、追加のインデックスを構築することなく、そのパラメータにエンコードされる。
論文 参考訳(メタデータ) (2022-08-16T10:22:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。