Fugu-MT 論文翻訳(概要): Scaling Retrieval-Augmented Reasoning with Parallel Search and Explicit Merging

論文の概要: Scaling Retrieval-Augmented Reasoning with Parallel Search and Explicit Merging

arxiv url: http://arxiv.org/abs/2605.13534v1
Date: Wed, 13 May 2026 13:46:35 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-14 23:30:28.080364
Title: Scaling Retrieval-Augmented Reasoning with Parallel Search and Explicit Merging
Title（参考訳）: 並列探索と明示的マージによる検索強化推論のスケーリング
Authors: Jiabei Liu, Wenyu Mao, Junfei Tan, Chunxu Shen, Lingling Yi, Jiancan Wu, Xiang Wang,
Abstract要約: MultiSearchはRLベースのフレームワークで、マルチクエリ検索と、検索した情報の明示的なマージを通じて制限に対処する。各推論ステップにおいて、MultiSearchは複数の視点からクエリを生成し、外部情報を並列に検索し、関連する情報の範囲を広げる。そして、このエージェントは、マージ処理時に取得した情報を統合精製し、SNRを改善し、より正確な推論を保証する。
参考スコア（独自算出の注目度）: 14.434955701466597
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep search agents have proven effective in enhancing LLMs by retrieving external knowledge during multi-step reasoning. However, existing methods often generate a single query for retrieval at each reasoning step, limiting information coverage and introducing high noise. This may result in low signal-to-noise ratios (SNR) during search, degrading reasoning accuracy and leading to unnecessary reasoning steps. In this paper, we introduce MultiSearch, an RL-based framework that addresses these limitations through multi-query retrieval and explicit merging of retrieved information. At each reasoning step, MultiSearch generates queries from multiple perspectives and retrieves external information in parallel, expanding the scope of relevant information and mitigating the reliance on any single retrieval result. Then, the agent consolidates and refines retrieved information at the merging process, improving the SNR and ensuring more accurate reasoning. Additionally, we propose a reinforcement learning framework with a multi-process reward design to optimize agents for both multi-query retrieval and information consolidation. Extensive experiments on seven benchmarks demonstrate that MultiSearch outperforms baseline methods, enhancing the SNR of retrieval and improving reasoning performance in question-answering tasks.
Abstract（参考訳）: 深層探索エージェントは多段階推論において外部知識を抽出することによりLCMの強化に有効であることが証明されている。しかし、既存の手法は、情報カバレッジを制限し、ノイズを発生させるため、各推論ステップで単一のクエリを生成することが多い。これは、探索中に低信号-雑音比(SNR)が生じ、推論精度が低下し、不要な推論ステップが生じる可能性がある。本稿では、マルチクエリ検索と検索情報の明示的なマージにより、これらの制限に対処するRLベースのフレームワークであるMultiSearchを紹介する。各推論ステップにおいて、MultiSearchは複数のパースペクティブからクエリを生成し、外部情報を並列に検索し、関連する情報の範囲を広げ、単一の検索結果への依存を軽減する。そして、このエージェントは、マージ処理時に取得した情報を統合精製し、SNRを改善し、より正確な推論を保証する。さらに,マルチクエリ検索と情報統合のためのエージェントを最適化するために,マルチプロセス報酬設計による強化学習フレームワークを提案する。 7つのベンチマークにおいて、MultiSearchはベースライン手法より優れ、検索のSNRが向上し、質問応答タスクにおける推論性能が向上することを示した。

関連論文リスト

Beyond the limitation of a single query: Train your LLM for query expansion with Reinforcement Learning [23.104182075898297]
Reasoning-augmented search agent, such as Search-R1, are trained to reason, search, and generate the final answer repeateratively。我々は、強化学習によるクエリ拡張のネイティブ機能を備えたLLMベースの検索エージェントを訓練する。シュレッシャーモデルの助けを借りて,小型の3B LLMでもクエリ拡張の強力な能力を実証できることが判明した。
論文参考訳（メタデータ） (2025-10-11T04:23:30Z)
MSRS: Evaluating Multi-Source Retrieval-Augmented Generation [51.717139132190574]
多くの現実世界のアプリケーションは、複数のソースにまたがる情報を統合して要約する能力を必要としている。本稿では、RAGシステムに対して異なるソース間で情報を統合するための評価ベンチマークを構築するためのスケーラブルなフレームワークを提案する。
論文参考訳（メタデータ） (2025-08-28T14:59:55Z)
DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文参考訳（メタデータ） (2025-07-29T17:55:23Z)
DynaSearcher: Dynamic Knowledge Graph Augmented Search Agent via Multi-Reward Reinforcement Learning [5.280613615397194]
DynaSearcherは動的知識グラフとマルチリワード強化学習(RL)によって強化された革新的な検索エージェントである検索精度, 効率, 応答品質などの学習目標を詳細に制御するために, マルチリワード RL フレームワークを用いる。実験により,提案手法は6つのマルチホップ質問応答データセットに対して,最先端の回答精度を実現することを示す。
論文参考訳（メタデータ） (2025-07-23T09:58:31Z)
MMSearch-R1: Incentivizing LMMs to Search [49.889749277236376]
MMSearch-R1は,実世界のインターネット環境において,オンデマンドでマルチターン検索が可能な,初のエンドツーエンド強化学習フレームワークである。本フレームワークは画像検索とテキスト検索の両方を統合し,検索ペナルティによる結果に基づく報酬によって,モデルがいつ,どのように呼び出すかの判断を可能にする。
論文参考訳（メタデータ） (2025-06-25T17:59:42Z)
R-Search: Empowering LLM Reasoning with Search via Multi-Reward Reinforcement Learning [0.8388591755871735]
R-SearchはReasoning-Search統合のための強化学習フレームワークである。ディープ・サーチ・インタラクションを伴う多段階推論を自律的に実行するために,大規模言語モデルを誘導する。 R-Searchは,マルチリワード信号による最適推論探索軌跡を学習する。
論文参考訳（メタデータ） (2025-06-04T17:29:22Z)
Iterative Self-Incentivization Empowers Large Language Models as Agentic Searchers [74.17516978246152]
大規模言語モデル(LLM)は、従来の手法を進化させるために情報検索に広く統合されている。エージェント検索フレームワークであるEXSEARCHを提案する。 4つの知識集約ベンチマークの実験では、EXSEARCHはベースラインを大幅に上回っている。
論文参考訳（メタデータ） (2025-05-26T15:27:55Z)
Knowledge-Aware Iterative Retrieval for Multi-Agent Systems [0.0]
本稿では,新しい大規模言語モデル (LLM) によるエージェントフレームワークを提案する。動的に進化する知識を活用することで、クエリを反復的に洗練し、文脈的証拠をフィルタリングする。提案システムは、更新されたコンテキストの競合的および協調的な共有をサポートする。
論文参考訳（メタデータ） (2025-03-17T15:27:02Z)
MultiConIR: Towards multi-condition Information Retrieval [38.864056667809095]
MultiConIRは、複雑なマルチ条件クエリシナリオ下での検索および再ランクモデルの評価のために設計されたベンチマークである。ほとんどのレトリバーとリランカは、クエリの複雑さが増大するにつれて、パフォーマンスが大幅に低下する。この研究は、リランカの性能劣化の原因を解明し、クエリ内の条件位置が類似性評価にどのように影響するかを検討する。
論文参考訳（メタデータ） (2025-03-11T05:02:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。