論文の概要: Mitigating Hallucination on Hallucination in RAG via Ensemble Voting
- arxiv url: http://arxiv.org/abs/2603.27253v1
- Date: Sat, 28 Mar 2026 12:07:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.868693
- Title: Mitigating Hallucination on Hallucination in RAG via Ensemble Voting
- Title(参考訳): アンサンブル投票によるRAGにおける幻覚の緩和
- Authors: Zequn Xie, Zhengyang Sun,
- Abstract要約: Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)における幻覚を減らすために、外部知識を統合することを目的としている。
VOTE-RAGは,2段階構造と効率よく並列化可能な投票機構を備えた,新しい学習自由フレームワークである。
我々の研究は、単純で信頼性の高いアンサンブル投票がRAG幻覚を緩和するための優れた、より効率的な方法であることを実証している。
- 参考スコア(独自算出の注目度): 0.2578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieval-Augmented Generation (RAG) aims to reduce hallucinations in Large Language Models (LLMs) by integrating external knowledge. However, RAG introduces a critical challenge: hallucination on hallucination," where flawed retrieval results mislead the generation model, leading to compounded hallucinations. To address this issue, we propose VOTE-RAG, a novel, training-free framework with a two-stage structure and efficient, parallelizable voting mechanisms. VOTE-RAG includes: (1) Retrieval Voting, where multiple agents generate diverse queries in parallel and aggregate all retrieved documents; (2) Response Voting, where multiple agents independently generate answers based on the aggregated documents, with the final output determined by majority vote. We conduct comparative experiments on six benchmark datasets. Our results show that VOTE-RAG achieves performance comparable to or surpassing more complex frameworks. Additionally, VOTE-RAG features a simpler architecture, is fully parallelizable, and avoids the problem drift" risk. Our work demonstrates that simple, reliable ensemble voting is a superior and more efficient method for mitigating RAG hallucinations.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、大規模言語モデル(LLM)における幻覚を減らすために、外部知識を統合することを目的としている。
しかし、RAGは「幻覚に関する幻覚」という、欠陥のある検索結果が生成モデルを誤解させ、複合幻覚に繋がる重要な課題を紹介している。この問題に対処するために、VOTE-RAGを提案する。VOTE-RAGは、2段階構造と効率的で並列化可能な新しいフレームワークである。VOTE-RAGには、(1)複数のエージェントが並列で多様なクエリを生成し、全ての検索された文書を集約する検索投票、(2)複数のエージェントが集約された文書に基づいて回答を独立に生成する応答投票、そして、多数決によって最終的な結果が決定される。我々は、VOTE-RAGが6つのベンチマークデータセットで比較実験を行った。
我々の研究は、単純で信頼性の高いアンサンブル投票がRAG幻覚を緩和するための優れた、より効率的な方法であることを実証している。
関連論文リスト
- Efficient Test-Time Retrieval Augmented Generation [40.84120171611779]
本稿では, ET2RAG というテスト時間検索拡張フレームワークを提案し, 大規模言語モデルの性能向上を図る。
具体的には、ET2RAGはトレーニング不要の手法であり、まず最も関連性の高い文書を検索し、LSMを増強し、多様な候補の応答を効率的に生成する。
論文 参考訳(メタデータ) (2025-11-02T19:32:39Z) - VisRAG 2.0: Evidence-Guided Multi-Image Reasoning in Visual Retrieval-Augmented Generation [64.82775032985485]
視覚検索強化世代(VRAG)は視覚言語モデル(VLM)を外的視覚知識で拡張し、基礎推論を行い幻覚を減らす。
しかし、現在のVRAGシステムは、複数の画像に対して確実な認識と証拠の統合に失敗し、根拠の弱さと誤った結論に繋がることが多い。
EVisRAGは,エビデンス誘導型マルチイメージで推論を学習し,この問題に対処するエンド・ツー・エンドのフレームワークである。
論文 参考訳(メタデータ) (2025-10-10T13:34:23Z) - Beyond Majority Voting: LLM Aggregation by Leveraging Higher-Order Information [57.397381631496906]
最適重み(OW)と逆サプライシング人気度(ISP)という2つの新しいアグリゲーションアルゴリズムを開発した。
我々の理論的分析は、これらの手法が軽微な仮定の下での多数決の本質的な制限を確実に緩和することを示している。
我々は,我々のアルゴリズムを人工データセット,UltraFeedbackやMMLUなどのLLMファインチューニングベンチマーク,実世界の医療環境ARMMAN上で実証的に検証した。
論文 参考訳(メタデータ) (2025-10-01T22:21:50Z) - Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs [69.10441885629787]
Retrieval-Augmented Generation (RAG) は、外部知識を注入することによって、Large Language Models (LLM) の事実性を高める。
逆に、純粋に推論指向のアプローチは、しばしば幻覚的あるいは誤った事実を必要とする。
この調査は両鎖を統一的推論-検索の観点から合成する。
論文 参考訳(メタデータ) (2025-07-13T03:29:41Z) - Removal of Hallucination on Hallucination: Debate-Augmented RAG [10.501398822864363]
Debate-Augmented RAG (DRAG) は、Multi-Agent Debate (MAD) メカニズムを検索と生成の両方の段階に統合する、トレーニング不要のフレームワークである。
検索においてDRAGは、提案者、反対者、裁判官の間で構造化された議論を採用し、検索品質を洗練させ、事実の信頼性を確保する。
DRAGは、非対称な情報の役割と敵の議論を導入し、推論の堅牢性を高め、事実の矛盾を緩和する。
論文 参考訳(メタデータ) (2025-05-24T08:15:22Z) - BRIDO: Bringing Democratic Order to Abstractive Summarization [3.053720182019654]
幻覚とは、大きな言語モデル(LLM)から生成される不正確な、無関係で一貫性のないテキストを指す。
同様の露光バイアス緩和戦略を用いるが,幻覚の少ない目標を掲げたモデルを提案する。
提案手法は,この側面を利用してコントラスト学習を行い,候補を高い候補間ROUGEスコアでインセンティブを与える。
論文 参考訳(メタデータ) (2025-02-25T16:33:50Z) - Speculative RAG: Enhancing Retrieval Augmented Generation through Drafting [68.90949377014742]
Speculative RAG(投機的RAG)は、より大規模なジェネラリストLMを利用して、より小さな蒸留専門のLMによって並列に生成された複数のRAGドラフトを効率よく検証するフレームワークである。
提案手法は,より小さな専門家のLMにドラフト作成を委譲することでRAGを加速し,より大きなジェネラリストのLMがドラフトに1回の検証パスを実行する。
PubHealthの従来のRAGシステムと比較して、レイテンシを50.83%削減しながら、最大12.97%の精度向上を実現している。
論文 参考訳(メタデータ) (2024-07-11T06:50:19Z) - Reranking Overgenerated Responses for End-to-End Task-Oriented Dialogue
Systems [71.33737787564966]
エンド・ツー・エンド(E2E)タスク指向対話システム(ToD)は、いわゆる「いいね!
本稿では,システムによって当初過剰に生成された応答リストから高品質な項目を選択する方法を提案する。
本研究では,最先端のE2E ToDシステムを2.4BLEU,3.2ROUGE,2.8 METEORで改善し,新たなピーク値を得た。
論文 参考訳(メタデータ) (2022-11-07T15:59:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。