論文の概要: MedRAGChecker: Claim-Level Verification for Biomedical Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2601.06519v1
- Date: Sat, 10 Jan 2026 10:40:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.858413
- Title: MedRAGChecker: Claim-Level Verification for Biomedical Retrieval-Augmented Generation
- Title(参考訳): MedRAGChecker: バイオメディカル検索生成のためのクレームレベル検証
- Authors: Yuelyu Ji, Min Gu Kwak, Hang Zhang, Xizhi Wu, Chenyu Li, Yanshan Wang,
- Abstract要約: バイオメディカルRAGのためのクレームレベル検証および診断フレームワークであるMedRAGCheckerを紹介する。
MedRAGCheckerは、質問、証拠の回収、そして生成された回答を与えられた上で、答えを原子的クレームに分解し、クレームのサポートを見積もる。
我々は、MedRAGCheckerが確実にフラグを解除し、主張を否定し、ジェネレータ間で異なるリスクプロファイルを明らかにしていることを示す。
- 参考スコア(独自算出の注目度): 8.37586466142299
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Biomedical retrieval-augmented generation (RAG) can ground LLM answers in medical literature, yet long-form outputs often contain isolated unsupported or contradictory claims with safety implications. We introduce MedRAGChecker, a claim-level verification and diagnostic framework for biomedical RAG. Given a question, retrieved evidence, and a generated answer, MedRAGChecker decomposes the answer into atomic claims and estimates claim support by combining evidence-grounded natural language inference (NLI) with biomedical knowledge-graph (KG) consistency signals. Aggregating claim decisions yields answer-level diagnostics that help disentangle retrieval and generation failures, including faithfulness, under-evidence, contradiction, and safety-critical error rates. To enable scalable evaluation, we distill the pipeline into compact biomedical models and use an ensemble verifier with class-specific reliability weighting. Experiments on four biomedical QA benchmarks show that MedRAGChecker reliably flags unsupported and contradicted claims and reveals distinct risk profiles across generators, particularly on safety-critical biomedical relations.
- Abstract(参考訳): バイオメディカル検索増強世代(RAG)は、LLMの回答を医学文献に根拠付けることができるが、長期的なアウトプットは、しばしば、安全性に影響を及ぼす独立した、または矛盾した主張を含む。
バイオメディカルRAGのためのクレームレベル検証および診断フレームワークであるMedRAGCheckerを紹介する。
MedRAGCheckerは、質問、証拠の回収、そして生成された回答を与えられ、その答えを原子的クレームに分解し、エビデンス基底の自然言語推論(NLI)とバイオメディカルナレッジグラフ(KG)の整合性信号を組み合わせることによってクレームサポートを推定する。
アグリゲーションのクレーム決定は、信頼性、過小評価、矛盾、安全クリティカルなエラー率など、検索と生成失敗を混乱させるのに役立つ回答レベルの診断をもたらす。
スケーラブルな評価を実現するため、我々はパイプラインをコンパクトなバイオメディカルモデルに蒸留し、クラス固有の信頼性重み付けを備えたアンサンブル検証器を使用する。
4つのバイオメディカルQAベンチマークの実験では、MedRAGCheckerは確実にフラグを掲げず、主張に矛盾し、特に安全クリティカルなバイオメディカル関係において、ジェネレータ間で異なるリスクプロファイルを明らかにしている。
関連論文リスト
- Self-MedRAG: a Self-Reflective Hybrid Retrieval-Augmented Generation Framework for Reliable Medical Question Answering [39.146761527401424]
Self-MedRAGは、臨床推論の反復的仮説検証プロセスを模倣するために設計された自己反射型ハイブリッドフレームワークである。
Sparse(BM25)とReciprocal Rank Fusion(Reciprocal Rank Fusion)による高密度(Contriever)レトリバーを組み合わせたハイブリッド検索戦略を統合している。
ジェネレータを使用して、支持する合理性で回答を生成し、軽量な自己回帰モジュールで評価する。
論文 参考訳(メタデータ) (2026-01-08T02:56:04Z) - MedTrust-RAG: Evidence Verification and Trust Alignment for Biomedical Question Answering [21.855579328680246]
MedTrust-Guided Iterative RAGは,医療用QAにおける事実整合性と幻覚を高めるためのフレームワークである。
第一に、検索された医療文書に、すべての生成されたコンテンツを明示的に根拠付けることを要求することにより、引用認識推論を強制する。
第2に、検証エージェントが証拠の妥当性を評価する反復的な検索検証プロセスを採用する。
論文 参考訳(メタデータ) (2025-10-16T07:59:11Z) - Combating Biomedical Misinformation through Multi-modal Claim Detection and Evidence-based Verification [11.555285143713315]
CER(Combining Evidence and Reasoning)は、バイオメディカルな事実チェックのための新しいフレームワークである。
科学的エビデンス検索、大規模言語モデルによる推論、および教師付き正確性予測を統合している。
幻覚のリスクを効果的に軽減し、生成したアウトプットが検証可能なエビデンスベースの情報源で根拠付けられていることを保証する。
論文 参考訳(メタデータ) (2025-09-17T10:31:09Z) - Combining Evidence and Reasoning for Biomedical Fact-Checking [11.555285143713315]
CER(Combin-ing Evidence and Reasoning)は、バイオメディカルな事実チェックのための新しいフレームワークである。
科学的エビデンス検索、大規模言語モデルによる推論、および教師付き正確性予測を統合している。
論文 参考訳(メタデータ) (2025-09-17T10:14:56Z) - MedKGent: A Large Language Model Agent Framework for Constructing Temporally Evolving Medical Knowledge Graph [57.54231831309079]
我々は、時間的に進化する医療知識グラフを構築するためのフレームワークであるMedKGentを紹介する。
生医学的知識の出現を, 微粒な日々の時系列でシミュレートする。
結果として得られるKGは156,275個のエンティティと2,971,384個のリレーショナルトリプルを含む。
論文 参考訳(メタデータ) (2025-08-17T15:14:03Z) - Comprehensive and Practical Evaluation of Retrieval-Augmented Generation Systems for Medical Question Answering [70.44269982045415]
Retrieval-augmented Generation (RAG) は,大規模言語モデル (LLM) の性能向上のための有望なアプローチとして登場した。
医療用QAデータセットに様々な補助的要素を提供するMedRGB(MedRGB)を導入する。
実験結果から,検索した文書のノイズや誤情報の処理能力に限界があることが判明した。
論文 参考訳(メタデータ) (2024-11-14T06:19:18Z) - MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models [49.765466293296186]
近年,Med-LVLM (Med-LVLMs) の進歩により,対話型診断ツールの新たな可能性が高まっている。
Med-LVLMは、しばしば事実の幻覚に悩まされ、誤った診断につながることがある。
我々は,Med-LVLMの現実性を高めるために,多目的マルチモーダルRAGシステムMMed-RAGを提案する。
論文 参考訳(メタデータ) (2024-10-16T23:03:27Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。