論文の概要: Knowing You Don't Know: Learning When to Continue Search in Multi-round RAG through Self-Practicing
- arxiv url: http://arxiv.org/abs/2505.02811v1
- Date: Mon, 05 May 2025 17:39:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.756372
- Title: Knowing You Don't Know: Learning When to Continue Search in Multi-round RAG through Self-Practicing
- Title(参考訳): 知らないことを知る: 自己実践を通してマルチラウンドRAGで検索を継続する方法を学ぶ
- Authors: Diji Yang, Linda Zeng, Jinmeng Rao, Yi Zhang,
- Abstract要約: RAGは、言語モデルの知識を高め、AI生成幻覚を減らす強力な能力を示した。
現在のマルチラウンドRAGシステムは、十分な情報が既に取得されている場合でも検索を続けることができる。
本稿では,RAGシステムの自己認識とマルチラウンド検索機能を強化するための新しいフレームワークである textbfSIM-RAG を提案する。
- 参考スコア(独自算出の注目度): 4.874077691069634
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval Augmented Generation (RAG) has shown strong capability in enhancing language models' knowledge and reducing AI generative hallucinations, driving its widespread use. However, complex tasks requiring multi-round retrieval remain challenging, and early attempts tend to be overly optimistic without a good sense of self-skepticism. Current multi-round RAG systems may continue searching even when enough information has already been retrieved, or they may provide incorrect answers without having sufficient information or knowledge. Existing solutions either require large amounts of expensive human-labeled process supervision data or lead to subpar performance. This paper aims to address these limitations by introducing a new framework, \textbf{SIM-RAG}, to explicitly enhance RAG systems' self-awareness and multi-round retrieval capabilities. To train SIM-RAG, we first let a RAG system self-practice multi-round retrieval, augmenting existing question-answer pairs with intermediate inner monologue reasoning steps to generate synthetic training data. For each pair, the system may explore multiple retrieval paths, which are labeled as successful if they reach the correct answer and unsuccessful otherwise. Using this data, we train a lightweight information sufficiency Critic. At inference time, the Critic evaluates whether the RAG system has retrieved sufficient information at each round, guiding retrieval decisions and improving system-level self-awareness through in-context reinforcement learning. Experiments across multiple prominent RAG benchmarks show that SIM-RAG is an effective multi-round RAG solution. Furthermore, this framework is system-efficient, adding a lightweight component to RAG without requiring modifications to existing LLMs or search engines, and data-efficient, eliminating the need for costly human-annotated mid-step retrieval process supervision data.
- Abstract(参考訳): Retrieval Augmented Generation (RAG)は、言語モデルの知識を高め、AI生成幻覚を減らし、広く使われるようになった。
しかし、多ラウンド検索を必要とする複雑なタスクは依然として困難なままであり、初期の試みは、優れた自己懐疑論を伴わずに過度に楽観的である傾向にある。
現在のマルチラウンドRAGシステムは、十分な情報が既に取得されている場合でも検索を続けるか、あるいは十分な情報や知識を持っていなくても誤った回答を提供することができる。
既存のソリューションは、大量の人ラベルのプロセス監視データを必要とするか、サブパーパフォーマンスにつながるかのどちらかである。
本稿では,RAGシステムの自己認識能力と多ラウンド検索能力を明確に向上する新しいフレームワークである‘textbf{SIM-RAG} を導入することで,これらの制約に対処することを目的とする。
SIM-RAGをトレーニングするために、まずRAGシステムに複数ラウンド検索を自己実行させ、既存の問合せペアを中間的な内部モノローグ推論ステップで強化し、合成トレーニングデータを生成する。
それぞれのペアに対して、システムは複数の検索経路を探索し、正しい答えに達した場合、成功とラベル付けされ、そうでなければ失敗する。
このデータを用いて、軽量な情報満足度批判を訓練する。
推論時に、批評家は、RAGシステムが各ラウンドで十分な情報を取得し、検索決定を導き、コンテキスト内強化学習を通じてシステムレベルの自己認識を改善するかどうかを評価する。
複数の顕著なRAGベンチマークで実験したところ、SIM-RAGは効果的なマルチラウンドRAGソリューションであることがわかった。
さらに、このフレームワークはシステム効率が高く、既存のLLMや検索エンジンの変更を必要とせずにRAGに軽量なコンポーネントを追加し、データ効率を向上し、人為的な中段階検索プロセスの監視データを必要としない。
関連論文リスト
- Chain-of-Retrieval Augmented Generation [72.06205327186069]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - Auto-RAG: Autonomous Retrieval-Augmented Generation for Large Language Models [31.769428095250912]
Auto-RAGは大規模言語モデル(LLM)の推論機能を中心とした自律的反復検索モデルである
本研究では,反復検索における推論に基づく意思決定命令を自律的に合成する手法を開発した。
Auto-RAGは自然言語で反復的な検索プロセスを表現し、解釈可能性を高める。
論文 参考訳(メタデータ) (2024-11-29T03:01:05Z) - DeepNote: Note-Centric Deep Retrieval-Augmented Generation [72.70046559930555]
Retrieval-Augmented Generation (RAG)は質問応答のための大規模言語モデル(LLM)における事実誤りと幻覚を緩和する
我々は、ノート中心の適応検索により、知識ソースの奥深くで堅牢な探索を実現する適応RAGフレームワークであるDeepNoteを開発した。
論文 参考訳(メタデータ) (2024-10-11T14:03:29Z) - FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research [70.6584488911715]
検索増強世代(RAG)は、かなりの研究関心を集めている。
既存のRAGツールキットは、しばしば重くて柔軟であり、研究者のカスタマイズのニーズを満たすことができない。
我々のツールキットは16の高度なRAGメソッドを実装し、38のベンチマークデータセットを収集し、整理した。
論文 参考訳(メタデータ) (2024-05-22T12:12:40Z) - Retrieval-Augmented Generation for AI-Generated Content: A Survey [38.50754568320154]
このような課題に対処するためのパラダイムとして,レトリーバル拡張生成(RAG)が登場している。
RAGは情報検索プロセスを導入し、利用可能なデータストアから関連オブジェクトを検索することで生成プロセスを強化する。
本稿では,RAG手法をAIGCシナリオに統合する既存の取り組みを概観的にレビューする。
論文 参考訳(メタデータ) (2024-02-29T18:59:01Z) - CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models [49.16989035566899]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の能力を高める技術である。
本稿では,大規模かつ包括的なベンチマークを構築し,様々なRAGアプリケーションシナリオにおけるRAGシステムのすべてのコンポーネントを評価する。
論文 参考訳(メタデータ) (2024-01-30T14:25:32Z) - The Power of Noise: Redefining Retrieval for RAG Systems [19.387105120040157]
Retrieval-Augmented Generation (RAG) は、大規模言語モデルの事前学習知識を超えて拡張する方法として登場した。
我々は、RAGソリューションが取得すべきパスIRシステムの種類に焦点を当てる。
論文 参考訳(メタデータ) (2024-01-26T14:14:59Z) - Retrieval-Augmented Generation for Large Language Models: A Survey [17.82361213043507]
大きな言語モデル(LLM)には印象的な能力があるが、幻覚のような課題に直面している。
Retrieval-Augmented Generation (RAG) は,外部データベースからの知識を取り入れた,有望なソリューションとして登場した。
論文 参考訳(メタデータ) (2023-12-18T07:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。