論文の概要: MedBioRAG: Semantic Search and Retrieval-Augmented Generation with Large Language Models for Medical and Biological QA
- arxiv url: http://arxiv.org/abs/2512.10996v1
- Date: Wed, 10 Dec 2025 15:43:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.512354
- Title: MedBioRAG: Semantic Search and Retrieval-Augmented Generation with Large Language Models for Medical and Biological QA
- Title(参考訳): MedBioRAG:医学的・生物学的QAのための大規模言語モデルを用いた意味探索と検索型生成
- Authors: Seonok Kim,
- Abstract要約: MedBioRAGは、バイオメディカル質問応答(QA)性能を改善するために設計された検索拡張モデルである。
ベンチマークデータセットを用いてテキスト検索,クローズドQA,長期QAタスク間でMedBioRAGを評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in retrieval-augmented generation (RAG) have significantly enhanced the ability of large language models (LLMs) to perform complex question-answering (QA) tasks. In this paper, we introduce MedBioRAG, a retrieval-augmented model designed to improve biomedical QA performance through a combination of semantic and lexical search, document retrieval, and supervised fine-tuning. MedBioRAG efficiently retrieves and ranks relevant biomedical documents, enabling precise and context-aware response generation. We evaluate MedBioRAG across text retrieval, close-ended QA, and long-form QA tasks using benchmark datasets such as NFCorpus, TREC-COVID, MedQA, PubMedQA, and BioASQ. Experimental results demonstrate that MedBioRAG outperforms previous state-of-the-art (SoTA) models and the GPT-4o base model in all evaluated tasks. Notably, our approach improves NDCG and MRR scores for document retrieval, while achieving higher accuracy in close-ended QA and ROUGE scores in long-form QA. Our findings highlight the effectiveness of semantic search-based retrieval and LLM fine-tuning in biomedical applications.
- Abstract(参考訳): 検索強化世代(RAG)の最近の進歩は、大規模言語モデル(LLM)による複雑な質問応答(QA)タスクの実行能力を大幅に向上させてきた。
本稿では,バイオメディカルQAの性能向上を目的とした検索モデルであるMedBioRAGについて,意味検索と語彙検索,文書検索,教師付き微調整を組み合わせることで紹介する。
MedBioRAGは、関連バイオメディカル文書を効率よく検索し、ランク付けし、正確かつコンテキスト対応の応答生成を可能にする。
我々はNFCorpus, TREC-COVID, MedQA, PubMedQA, BioASQなどのベンチマークデータセットを用いてテキスト検索, クローズドQA, 長期QAタスク間でMedBioRAGを評価した。
実験結果から,MedBioRAGは従来の SoTA モデルと GPT-4o ベースモデルよりも優れた性能を示した。
提案手法は文書検索におけるNDCGとMRRのスコアを改善するとともに,QAとROUGEのスコアを長期のQAで高い精度で取得する。
本研究は, バイオメディカル応用におけるセマンティック検索とLLM微調整の有効性を明らかにするものである。
関連論文リスト
- RAG-BioQA Retrieval-Augmented Generation for Long-Form Biomedical Question Answering [0.0]
本稿では,検索拡張世代とドメイン固有の微調整を組み合わせた新しいフレームワークであるRAG-BioQAについて述べる。
PubMedQAデータセットの実験結果は、ベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-10-02T02:49:09Z) - Biomedical Literature Q&A System Using Retrieval-Augmented Generation (RAG) [0.0]
本報告では, バイオメディカル文献質問応答システム(Q&A)について述べる。
このシステムは、PubMedの記事、キュレートされたQ&Aデータセット、医療百科事典など、さまざまなソースを統合している。
このシステムは一般の医療クエリとドメイン固有のタスクの両方をサポートし、乳がんの文献に焦点を絞った評価を行う。
論文 参考訳(メタデータ) (2025-09-05T21:29:52Z) - MedGemma Technical Report [75.88152277443179]
MedGemmaは、Gemma 3 4Bと27Bをベースとした医療ビジョン言語基盤モデルの集合体である。
MedGemmaは、画像とテキストの高度な医学的理解と推論を実証する。
また、SigLIPから派生した医用目視エンコーダであるMedSigLIPを紹介する。
論文 参考訳(メタデータ) (2025-07-07T17:01:44Z) - Efficient and Reproducible Biomedical Question Answering using Retrieval Augmented Generation [1.6336299799055092]
本研究では, バイオメディカルQAのための検索補助生成システム (RAG) を体系的に検討した。
我々はまず,BM25,BioBERT,MedCPT,ハイブリッドアプローチなど,最先端の検索手法を評価する。
最終的なRAGシステムを24M PubMedコーパス上に展開し、レトリバーが全体のパフォーマンスに与える影響を比較した。
論文 参考訳(メタデータ) (2025-05-12T14:51:47Z) - MedBioLM: Optimizing Medical and Biological QA with Fine-Tuned Large Language Models and Retrieval-Augmented Generation [0.0]
本稿では,ドメイン適応型バイオメディカル質問応答モデルであるMedBioLMを紹介する。
MedBioLMは、微調整および検索拡張生成(RAG)を統合することで、ドメイン固有の知識を動的に組み込む。
微調整はベンチマークデータセットの精度を大幅に向上する一方、RAGは事実整合性を高める。
論文 参考訳(メタデータ) (2025-02-05T08:58:35Z) - Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering [70.44269982045415]
Retrieval-augmented Generation (RAG) は,大規模言語モデル (LLM) の性能向上のための有望なアプローチとして登場した。
医療用QAデータセットに様々な補助的要素を提供するMedRGB(MedRGB)を導入する。
実験結果から,検索した文書のノイズや誤情報の処理能力に限界があることが判明した。
論文 参考訳(メタデータ) (2024-11-14T06:19:18Z) - NeuroSym-BioCAT: Leveraging Neuro-Symbolic Methods for Biomedical Scholarly Document Categorization and Question Answering [0.14999444543328289]
本稿では,最適化されたトピックモデリングフレームワークであるOVB-LDAとBI-POP CMA-ES最適化技術を統合し,学術文書の抽象分類を強化した新しい手法を提案する。
我々は、ドメイン固有データに基づいて微調整された蒸留MiniLMモデルを用いて、高精度な回答抽出を行う。
論文 参考訳(メタデータ) (2024-10-29T14:45:12Z) - SeRTS: Self-Rewarding Tree Search for Biomedical Retrieval-Augmented Generation [50.26966969163348]
大規模言語モデル(LLM)は,検索増強世代(RAG)の進展に伴い,生物医学領域において大きな可能性を示した。
既存の検索強化アプローチは、様々なクエリやドキュメント、特に医療知識クエリに対処する上で、課題に直面している。
モンテカルロ木探索(MCTS)と自己回帰パラダイムに基づく自己回帰木探索(SeRTS)を提案する。
論文 参考訳(メタデータ) (2024-06-17T06:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。