論文の概要: MAO-ARAG: Multi-Agent Orchestration for Adaptive Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2508.01005v1
- Date: Fri, 01 Aug 2025 18:15:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.659145
- Title: MAO-ARAG: Multi-Agent Orchestration for Adaptive Retrieval-Augmented Generation
- Title(参考訳): MAO-ARAG:適応検索拡張ジェネレーションのためのマルチエージェントオーケストレーション
- Authors: Yiqun Chen, Erhan Zhang, Lingyong Yan, Shuaiqiang Wang, Jizhou Huang, Dawei Yin, Jiaxin Mao,
- Abstract要約: 質問応答システム(QA)では、応答精度の向上と幻覚の軽減にRAG(Retrieval-Augmented Generation)が重要になっている。
マルチエージェントオーケストレーションを利用するMAO-ARAGという適応型RAGフレームワークを提案する。
- 参考スコア(独自算出の注目度): 35.853052535353775
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In question-answering (QA) systems, Retrieval-Augmented Generation (RAG) has become pivotal in enhancing response accuracy and reducing hallucination issues. The architecture of RAG systems varies significantly, encompassing single-round RAG, iterative RAG, and reasoning RAG, each tailored to address different types of queries. Due to the varying complexity of real-world queries, a fixed RAG pipeline often struggles to balance performance and cost efficiency across different queries. To address this challenge, we propose an adaptive RAG framework called MAO-ARAG, which leverages multi-agent orchestration. Our adaptive RAG is conceived as a multi-turn framework. Specifically, we define multiple executor agents, representing typical RAG modules such as query reformulation agents, document selection agent, and generation agents. A planner agent intelligently selects and integrates the appropriate agents from these executors into a suitable workflow tailored for each query, striving for high-quality answers while maintaining reasonable costs. During each turn, the planner agent is trained using reinforcement learning, guided by an outcome-based reward (F1 score) and a cost-based penalty, continuously improving answer quality while keeping costs within a reasonable range. Experiments conducted on multiple QA datasets demonstrate that our approach, which dynamically plans workflows for each query, not only achieves high answer quality but also maintains both cost and latency within acceptable limits.The code of MAO-ARAG is on https://github.com/chenyiqun/Agentic-RAG.
- Abstract(参考訳): 質問応答システム(QA)では、応答精度の向上と幻覚の軽減にRAG(Retrieval-Augmented Generation)が重要である。
RAGシステムのアーキテクチャは、単一ラウンドRAG、反復RAG、推論RAGを含み、それぞれ異なるタイプのクエリに対処するように調整されている。
実際のクエリの複雑さが多様であるため、修正されたRAGパイプラインは、異なるクエリ間でパフォーマンスとコスト効率のバランスをとるのに苦労することが多い。
この課題に対処するために,マルチエージェントオーケストレーションを利用するMAO-ARAGという適応型RAGフレームワークを提案する。
我々の適応RAGはマルチターンフレームワークとして考えられている。
具体的には、クエリ再構成エージェント、文書選択エージェント、生成エージェントなどの典型的なRAGモジュールを表す複数の実行エージェントを定義する。
プランナーエージェントは、これらの実行者から適切なエージェントをインテリジェントに選択し、各クエリに適したワークフローに統合し、適切なコストを維持しながら高品質な回答を求めます。
各ターン中に、結果ベース報酬(F1スコア)とコストベースペナルティに導かれる強化学習を用いてプランナーエージェントを訓練し、コストを合理的な範囲に維持しつつ、回答品質を継続的に改善する。
複数のQAデータセットで実施された実験では、クエリ毎に動的にワークフローを計画するアプローチが、高い応答品質を達成するだけでなく、許容範囲内でコストとレイテンシの両方を維持できることが示され、MAO-ARAGのコードはhttps://github.com/chenyiqun/Agentic-RAGに記載されている。
関連論文リスト
- MA-RAG: Multi-Agent Retrieval-Augmented Generation via Collaborative Chain-of-Thought Reasoning [43.66966457772646]
MA-RAGは、タスク認識推論でRAGパイプラインの各ステージに取り組むために、特別なAIエージェントの協力的なセットを編成する。
我々の設計では、モデルが微調整されることなく、情報の流れをきめ細かな制御が可能である。
このモジュラーおよび推論駆動アーキテクチャにより、MA-RAGは堅牢で解釈可能な結果を提供できる。
論文 参考訳(メタデータ) (2025-05-26T15:05:18Z) - RAG-Gym: Systematic Optimization of Language Agents for Retrieval-Augmented Generation [43.50113345998687]
本稿では,(1)プロンプトエンジニアリング,(2)アクターチューニング,(3)批判的トレーニングという,3つの最適化次元を探求する総合的なプラットフォームであるRAG-Gymを紹介する。
本稿では,リフレクション推論を取り入れた新しいエージェントであるRe$2$Searchを提案する。
アクターチューニングにおいて,プロセスの監督をきめ細かい3つの人気のあるポストトレーニングアルゴリズムを評価し,直接選好最適化を最も効果的に評価する。
論文 参考訳(メタデータ) (2025-02-19T18:56:03Z) - HawkBench: Investigating Resilience of RAG Methods on Stratified Information-Seeking Tasks [50.871243190126826]
HawkBenchは、RAGのパフォーマンスを厳格に評価するために設計された、人間ラベル付きマルチドメインベンチマークである。
情報探索行動に基づくタスクの階層化により、HawkBenchはRAGシステムが多様なユーザニーズにどのように適応するかを体系的に評価する。
論文 参考訳(メタデータ) (2025-02-19T06:33:39Z) - Improving Retrieval-Augmented Generation through Multi-Agent Reinforcement Learning [51.54046200512198]
Retrieval-augmented Generation (RAG) は、外部の現在の知識を大規模言語モデルに組み込むために広く利用されている。
標準的なRAGパイプラインは、クエリ書き換え、文書検索、文書フィルタリング、回答生成など、いくつかのコンポーネントから構成される。
これらの課題を克服するため,RAGパイプラインを多エージェント協調作業として,各コンポーネントをRLエージェントとして扱うことを提案する。
論文 参考訳(メタデータ) (2025-01-25T14:24:50Z) - Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG [0.8463972278020965]
大規模言語モデル(LLM)は、人間のようなテキスト生成や自然言語理解を可能にすることによって、人工知能(AI)に革命をもたらした。
Retrieval Augmented Generation (RAG) がソリューションとして登場し、リアルタイムデータ検索を統合して文脈に関連のある応答を提供することでLLMを強化している。
Agentic Retrieval-Augmented Generation (RAG)は、自律的なAIエージェントをRAGパイプラインに埋め込むことによって、これらの制限を超越する。
論文 参考訳(メタデータ) (2025-01-15T20:40:25Z) - Unanswerability Evaluation for Retrieval Augmented Generation [74.3022365715597]
UAEval4RAGは、RAGシステムが解答不能なクエリを効果的に処理できるかどうかを評価するために設計されたフレームワークである。
我々は、6つの未解決カテゴリを持つ分類を定義し、UAEval4RAGは、多様で挑戦的なクエリを自動的に合成する。
論文 参考訳(メタデータ) (2024-12-16T19:11:55Z) - SLA Management in Reconfigurable Multi-Agent RAG: A Systems Approach to Question Answering [0.0]
現実世界のアプリケーションには、SLA(Service Level Agreements)とQoS(Quality of Service)の要件が多様である。
実世界の質問応答(QA)アプリケーションに適したマルチエージェントRAGに対するシステム指向アプローチを提案する。
論文 参考訳(メタデータ) (2024-12-07T01:32:13Z) - AQA: Adaptive Question Answering in a Society of LLMs via Contextual Multi-Armed Bandit [59.10281630985958]
質問応答(QA)では、異なる質問を異なる回答戦略で効果的に扱うことができる。
本稿では,各質問に対して最適なQA戦略を適応的に選択する動的手法を提案する。
提案手法は,複数のモジュールを持つQAシステムの適応的オーケストレーションに有効であることを示す。
論文 参考訳(メタデータ) (2024-09-20T12:28:18Z) - Unified Active Retrieval for Retrieval Augmented Generation [69.63003043712696]
Retrieval-Augmented Generation (RAG)では、検索は必ずしも役に立たない。
既存のアクティブ検索手法は2つの課題に直面している。
彼らは通常、様々な種類の命令を扱うのに苦労する単一の基準に頼っている。
それらは特殊で高度に区別された手順に依存しており、それらを組み合わせることでRAGシステムはより複雑になる。
論文 参考訳(メタデータ) (2024-06-18T12:09:02Z) - Adaptive-RAG: Learning to Adapt Retrieval-Augmented Large Language Models through Question Complexity [59.57065228857247]
Retrieval-augmented Large Language Models (LLMs) は、質問回答(QA)のようなタスクにおける応答精度を高めるための有望なアプローチとして登場した。
本稿では,クエリの複雑さに基づいて,LLMの最適戦略を動的に選択できる適応型QAフレームワークを提案する。
オープンドメインのQAデータセットを用いて、複数のクエリの複雑さを網羅し、QAシステムの全体的な効率性と精度を高めることを示す。
論文 参考訳(メタデータ) (2024-03-21T13:52:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。