論文の概要: Removal of Hallucination on Hallucination: Debate-Augmented RAG
- arxiv url: http://arxiv.org/abs/2505.18581v1
- Date: Sat, 24 May 2025 08:15:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.518742
- Title: Removal of Hallucination on Hallucination: Debate-Augmented RAG
- Title(参考訳): 幻覚に対する幻覚の除去:Dbate-Augmented RAG
- Authors: Wentao Hu, Wengyu Zhang, Yiyang Jiang, Chen Jason Zhang, Xiaoyong Wei, Qing Li,
- Abstract要約: Debate-Augmented RAG (DRAG) は、Multi-Agent Debate (MAD) メカニズムを検索と生成の両方の段階に統合する、トレーニング不要のフレームワークである。
検索においてDRAGは、提案者、反対者、裁判官の間で構造化された議論を採用し、検索品質を洗練させ、事実の信頼性を確保する。
DRAGは、非対称な情報の役割と敵の議論を導入し、推論の堅牢性を高め、事実の矛盾を緩和する。
- 参考スコア(独自算出の注目度): 10.501398822864363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) enhances factual accuracy by integrating external knowledge, yet it introduces a critical issue: erroneous or biased retrieval can mislead generation, compounding hallucinations, a phenomenon we term Hallucination on Hallucination. To address this, we propose Debate-Augmented RAG (DRAG), a training-free framework that integrates Multi-Agent Debate (MAD) mechanisms into both retrieval and generation stages. In retrieval, DRAG employs structured debates among proponents, opponents, and judges to refine retrieval quality and ensure factual reliability. In generation, DRAG introduces asymmetric information roles and adversarial debates, enhancing reasoning robustness and mitigating factual inconsistencies. Evaluations across multiple tasks demonstrate that DRAG improves retrieval reliability, reduces RAG-induced hallucinations, and significantly enhances overall factual accuracy. Our code is available at https://github.com/Huenao/Debate-Augmented-RAG.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、外部知識を統合することで、事実の精度を高めるが、誤ったまたは偏見のある検索は、幻覚を混同し、幻覚の幻覚と呼ばれる現象を生じさせるという重大な問題を引き起こす。
そこで本研究では,マルチエージェント・デベート(MAD)機構を検索および生成段階に組み込む,トレーニング不要なフレームワークであるDabate-Augmented RAG(DRAG)を提案する。
検索においてDRAGは、提案者、反対者、裁判官の間で構造化された議論を採用し、検索品質を洗練させ、事実の信頼性を確保する。
DRAGは、非対称な情報の役割と敵の議論を導入し、推論の堅牢性を高め、事実の矛盾を緩和する。
複数のタスクにわたる評価は、DRAGが検索信頼性を改善し、RAGによる幻覚を低減し、全体的な事実精度を大幅に向上させることを示している。
私たちのコードはhttps://github.com/Huenao/Debate-Augmented-RAGで公開されています。
関連論文リスト
- HalluLens: LLM Hallucination Benchmark [49.170128733508335]
大規模言語モデル(LLM)は、しばしばユーザ入力やトレーニングデータから逸脱する応答を生成する。
本稿では,新たな内因性評価タスクと既存内因性評価タスクを併用した総合幻覚ベンチマークを提案する。
論文 参考訳(メタデータ) (2025-04-24T13:40:27Z) - ReDeEP: Detecting Hallucination in Retrieval-Augmented Generation via Mechanistic Interpretability [27.325766792146936]
パラメトリック(内部)知識の不足によって引き起こされる幻覚。
このような幻覚を検出するには、Large Language Models (LLM) が外部とパラメトリックの知識をどのように利用するかを理解する必要がある。
本稿では,LLMの外部文脈とパラメトリック知識を分離して幻覚を検出する手法であるReDeEPを提案する。
論文 参考訳(メタデータ) (2024-10-15T09:02:09Z) - A Cause-Effect Look at Alleviating Hallucination of Knowledge-grounded Dialogue Generation [51.53917938874146]
我々は,対話知識の相互作用を利用して,KGDの幻覚を緩和するための解決策を提案する。
本手法は,他の対話性能を損なうことなく幻覚を低減できることを示す。
論文 参考訳(メタデータ) (2024-04-04T14:45:26Z) - RAGged Edges: The Double-Edged Sword of Retrieval-Augmented Chatbots [6.893551641325889]
ChatGPTの幻覚(もっともらしいが偽の情報を生み出す)は大きな課題となる。
本稿では、外部知識をプロンプトと統合することにより、検索・拡張生成が幻覚にどのように対処できるかを考察する。
以上の結果から,RAGの精度は向上するが,事前学習されたモデル理解と直接矛盾する場合は,まだ誤解が残る可能性がある。
論文 参考訳(メタデータ) (2024-03-02T12:19:04Z) - Fine-grained Hallucination Detection and Editing for Language Models [109.56911670376932]
大規模言語モデル(LM)は、しばしば幻覚と呼ばれる事実的誤りを引き起こす傾向にある。
我々は,幻覚の包括的分類を導入し,幻覚が多様な形態で現れることを議論する。
本稿では, 幻覚自動検出のための新しいタスクを提案し, 新たな評価ベンチマークであるFavaBenchを構築した。
論文 参考訳(メタデータ) (2024-01-12T19:02:48Z) - HalluciDoctor: Mitigating Hallucinatory Toxicity in Visual Instruction Data [102.56792377624927]
機械生成データに固有の幻覚は未発見のままである。
本稿では,クロスチェックパラダイムに基づく新しい幻覚検出・除去フレームワークであるHaluciDoctorを提案する。
LLaVAに比べて44.6%の幻覚を緩和し,競争性能を維持した。
論文 参考訳(メタデータ) (2023-11-22T04:52:58Z) - Towards Mitigating Hallucination in Large Language Models via
Self-Reflection [63.2543947174318]
大規模言語モデル(LLM)は、質問応答(QA)タスクを含む生成的および知識集約的なタスクを約束している。
本稿では,広範に採用されているLCMとデータセットを用いた医療再生QAシステムにおける幻覚現象を解析する。
論文 参考訳(メタデータ) (2023-10-10T03:05:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。