Fugu-MT 論文翻訳(概要): Ruling Out to Rule In: Contrastive Hypothesis Retrieval for Medical Question Answering

論文の概要: Ruling Out to Rule In: Contrastive Hypothesis Retrieval for Medical Question Answering

arxiv url: http://arxiv.org/abs/2604.04593v1
Date: Mon, 06 Apr 2026 11:13:57 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-07 15:49:19.175079
Title: Ruling Out to Rule In: Contrastive Hypothesis Retrieval for Medical Question Answering
Title（参考訳）: Ruling out to Rule In:Contrastive hypothesis Retrieval for Medical Question Answering
Authors: Byeolhee Kim, Min-Kyung Kim, Young-Hak Kim, Tae-Joon Jeon,
Abstract要約: 臨床診断のプロセスに触発されたコントラスト的仮説検索(CHR)を提案する。 CHRは、$H+$-alignedのエビデンスを宣伝し、$H+$-alignedのコンテンツをペナルティ化する。 CHRは、検索機構の設計による臨床推論を橋渡しし、医療用RAGシステムにおける有害な汚染を減らすための実践的な方法を提供する。
参考スコア（独自算出の注目度）: 1.6886041345889138
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Retrieval-augmented generation (RAG) grounds large language models in external medical knowledge, yet standard retrievers frequently surface hard negatives that are semantically close to the query but describe clinically distinct conditions. While existing query-expansion methods improve query representation to mitigate ambiguity, they typically focus on enriching target-relevant semantics without an explicit mechanism to selectively suppress specific, clinically plausible hard negatives. This leaves the system prone to retrieving plausible mimics that overshadow the actual diagnosis, particularly when such mimics are dominant within the corpus. We propose Contrastive Hypothesis Retrieval (CHR), a framework inspired by the process of clinical differential diagnosis. CHR generates a target hypothesis $H^+$ for the likely correct answer and a mimic hypothesis $H^-$ for the most plausible incorrect alternative, then scores documents by promoting $H^+$-aligned evidence while penalizing $H^-$-aligned content. Across three medical QA benchmarks and three answer generators, CHR outperforms all five baselines in every configuration, with improvements of up to 10.4 percentage points over the next-best method. On the $n=587$ pooled cases where CHR answers correctly while embedded hypothetical-document query expansion does not, 85.2\% have no shared documents between the top-5 retrieval lists of CHR and of that baseline, consistent with substantive retrieval redirection rather than light re-ranking of the same candidates. By explicitly modeling what to avoid alongside what to find, CHR bridges clinical reasoning with retrieval mechanism design and offers a practical path to reducing hard-negative contamination in medical RAG systems.
Abstract（参考訳）: Retrieval-augmented Generation (RAG) は、外部の医療知識において大きな言語モデルを構築するが、標準的な検索者は、クエリにセマンティックに近いが臨床的に異なる条件を記述する硬い否定をしばしば表面化する。既存のクエリ拡張手法は、あいまいさを軽減するためにクエリ表現を改善するが、通常、特定の、臨床的に妥当なハードネガティブを選択的に抑制するための明示的なメカニズムなしで、ターゲット関連セマンティクスの強化に焦点を当てる。これは、特にそのような模倣がコーパス内で支配的である場合に、実際の診断を覆い隠した、もっともらしい模倣を回収する傾向にある。臨床診断のプロセスに触発されたコントラスト的仮説検索(CHR)を提案する。 CHR は、想定される正解に対して $H^+$ を、最も妥当な代替案に対して $H^-$ を、模擬仮説として $H^-$ を生成し、次に、$H^+$-aligned の内容をペナル化しながら、$H^+$-aligned の証拠を宣伝して文書をスコアする。 3つのQAベンチマークと3つの回答ジェネレータで、CHRはすべての構成において5つのベースラインを上回り、次のベストメソッドよりも最大10.4ポイント改善されている。 n=587$プールの場合、CHRが正しく答える一方で、組み込みの仮想文書クエリ拡張ができない場合、85.2\%はCHRの上位5つの検索リストとベースラインの間に共有文書を持っておらず、同じ候補の軽量な再ランクではなく、実質的な検索リダイレクトと一致している。 CHRは、何を見つけるべきかを明示的にモデル化することによって、検索機構の設計による臨床推論を橋渡しし、医療RAGシステムにおける有害な汚染を減らすための実践的な道筋を提供する。

関連論文リスト

Hypothesis-Conditioned Query Rewriting for Decision-Useful Retrieval [39.146761527401424]
Retrieval-Augmented Generation (RAG)は、外部の非パラメトリック知識を基礎として、Large Language Models (LLM)を改善する。既存のRAGメソッドは1つの初期クエリに依存しており、多くの場合、決定関連エビデンスよりもトピック的な関連性を好む。本稿では,RAGをトピック指向検索からエビデンス指向検索へ再帰させる訓練不要な事前検索フレームワークであるHCQRを提案する。
論文参考訳（メタデータ） (2026-03-19T15:15:58Z)
From Conflict to Consensus: Boosting Medical Reasoning via Multi-Round Agentic RAG [65.0203623486525]
大規模言語モデル(LLM)は、医学的質問応答において高い推論能力を示す。幻覚や時代遅れの知識を生み出す傾向は、医療分野において重大なリスクをもたらす。既存の手法はノイズの多いトークンレベルの信号に依存しており、複雑な推論に必要なマルチラウンドの改良は欠如している。
論文参考訳（メタデータ） (2026-02-06T08:25:30Z)
Self-MedRAG: a Self-Reflective Hybrid Retrieval-Augmented Generation Framework for Reliable Medical Question Answering [39.146761527401424]
Self-MedRAGは、臨床推論の反復的仮説検証プロセスを模倣するために設計された自己反射型ハイブリッドフレームワークである。 Sparse(BM25)とReciprocal Rank Fusion(Reciprocal Rank Fusion)による高密度(Contriever)レトリバーを組み合わせたハイブリッド検索戦略を統合している。ジェネレータを使用して、支持する合理性で回答を生成し、軽量な自己回帰モジュールで評価する。
論文参考訳（メタデータ） (2026-01-08T02:56:04Z)
MuISQA: Multi-Intent Retrieval-Augmented Generation for Scientific Question Answering [16.26521741515184]
Multi-Intent Scientific Question Answering (MuISQA) ベンチマークは、サブクエストにおける不均一なエビデンスカバレッジに基づくRAGシステムの評価を目的としている。さらに,大規模言語モデル(LLM)を利用した意図認識検索フレームワークを提案する。 MuISQAベンチマークおよび他の一般RAGデータセットを用いた実験により,本手法は従来手法,特に検索精度および証拠カバレッジにおいて,常に優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2025-11-20T12:03:36Z)
MedAlign: A Synergistic Framework of Multimodal Preference Optimization and Federated Meta-Cognitive Reasoning [52.064286116035134]
我々はMed-VQA(Med-VQA)のための視覚的LVLM応答を保証するフレームワークであるMedAlignを開発した。まず、優先学習を視覚的コンテキストに合わせるために、マルチモーダルな直接選好最適化(mDPO)の目的を提案する。次に、画像とテキストの類似性を生かし、クエリを専門的でコンテキスト拡張されたLVLMにルーティングする検索型混合処理(RA-MoE)アーキテクチャを設計する。
論文参考訳（メタデータ） (2025-10-24T02:11:05Z)
Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。 Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。 SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文参考訳（メタデータ） (2025-09-25T14:05:55Z)
ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning [54.30630356786752]
ReasonMedは、これまでで最大の医療推論データセットで、370万の高品質な例がある。マルチエージェント生成、検証、改善プロセスを通じて構築される。 ReasonMedを用いて、簡潔な答えの要約と詳細なCoT推論を統合することで、最も堅牢な微調整結果が得られる。
論文参考訳（メタデータ） (2025-06-11T08:36:55Z)
R2MED: A Benchmark for Reasoning-Driven Medical Retrieval [21.743193381874878]
推論駆動型医療検索のために設計された最初のベンチマークであるR2MEDを紹介する。 Q&A参照検索、臨床証拠検索、臨床症例検索の3つのタスクにまたがる876のクエリで構成されている。我々はR2MED上で広く使われている15の検索システムを評価し,最良モデルでさえ31.4 nDCG@10しか達成できないことを確認した。
論文参考訳（メタデータ） (2025-05-20T16:15:30Z)
ELOQ: Resources for Enhancing LLM Detection of Out-of-Scope Questions [52.33835101586687]
本研究では,検索した文書が意味的に類似しているように見えるスコープ外質問について検討するが,答えるために必要な情報がない。本稿では,閉経後の文書から多様なスコープ外質問を自動的に生成するための,幻覚に基づくELOQを提案する。
論文参考訳（メタデータ） (2024-10-18T16:11:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。