論文の概要: AgenticRAG: Agentic Retrieval for Enterprise Knowledge Bases
- arxiv url: http://arxiv.org/abs/2605.05538v1
- Date: Thu, 07 May 2026 00:39:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.460446
- Title: AgenticRAG: Agentic Retrieval for Enterprise Knowledge Bases
- Title(参考訳): AgenticRAG: 企業知識ベースのためのエージェント検索
- Authors: Susheel Suresh, Hazel Mak, Shangpo Chou, Fred Kroon, Sahil Bhatnagar,
- Abstract要約: 本稿では,企業知識ベース上での検索と分析のためのエージェントハーネスであるAgenticRAGを提案する。
我々のアプローチは、既存のエンタープライズ検索インフラの上に軽量なハーネスを積み重ねることで、この過度さを軽減します。
本研究は,実環境における実運用環境への適合性を示すものである。
- 参考スコア(独自算出の注目度): 0.7176906280023592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present AgenticRAG, a practical agentic harness for retrieval and analysis over enterprise knowledge bases. Standard RAG pipelines place significant burden of grounding on the search stack, constraining the language model to a fixed candidate set chosen deep in the retrieval process. Our approach reduces this overdependence by layering a lightweight harness on top of existing enterprise search infrastructure, equipping a reasoning LLM with search, find, open, and summarize tools enabling the model to iteratively retrieve information, navigate within documents, and analyze evidence autonomously. On three open benchmarks we observe substantial gains: $49.6\%$ recall@1 on BRIGHT (+21.8 pp over the best embedding baseline), 0.96 factuality on WixQA ($+13\%$ relative improvement), and $92\%$ answer correctness on FinanceBench--within 2 pp of oracle access to true evidence. Ablation studies show that the most significant factor is the shift from single-shot retrieval to agentic tool use ($5.9\times$ improvement), while multi-query search and in-document navigation contribute to both quality and efficiency. We present various design choices in our agentic harness that were informed by pre-production deployments. Our results demonstrate its suitability for real-world enterprise production environments.
- Abstract(参考訳): 本稿では,企業知識ベース上での検索と分析のためのエージェントハーネスであるAgenticRAGを提案する。
標準的なRAGパイプラインは、検索スタックを基盤として、検索プロセスで深く選択された固定された候補セットに言語モデルを制約する。
提案手法は,既存の企業検索基盤上に軽量なハーネスを積み重ね,検索,検索,検索,オープン,要約ツールを付加することで,モデルが情報を反復的に取得し,文書内をナビゲートし,エビデンスを自律的に分析することで,この過度さを軽減する。
BRIGHTの49.6\%$ recall@1(最高の埋め込みベースラインに対して+21.8pp)、WixQAの0.96の事実性(+13\%$相対的改善)、ファイナンスベンチの回答正しさ9.2\%$真の証拠へのオラクルアクセス2ppである。
アブレーション研究によると、最も重要な要素は単発検索からエージェントツールへのシフト($5.9\times$ Improvement)であり、マルチクエリ検索とドキュメント内ナビゲーションは品質と効率の両方に寄与している。
プリプロダクションデプロイメントによって通知されたエージェントハーネスに,さまざまな設計上の選択を提示する。
本研究は,実環境における実運用環境への適合性を示すものである。
関連論文リスト
- CoSearch: Joint Training of Reasoning and Document Ranking via Reinforcement Learning for Agentic Search [51.911048955965136]
CoSearchは多段階推論エージェントと生成ドキュメントランキングモデルを共同でトレーニングするフレームワークである。
この結果から, 推論エージェントと検索システムの協調訓練は, 実現可能であり, 性能も高いことが示唆された。
論文 参考訳(メタデータ) (2026-04-19T17:48:17Z) - FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [57.18367828883773]
FinAgentBenchは、ファイナンスにおける多段階推論によるエージェント検索を評価するためのベンチマークである。
このベンチマークは、S&P-500上場企業に関する26Kのエキスパートアノテート例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-08-07T22:15:22Z) - Benchmarking Deep Search over Heterogeneous Enterprise Data [73.55304268238474]
検索強化生成(RAG)の形式を評価するための新しいベンチマークを提案する。
RAGは、多種多様な、しかし関連するソースに対して、ソースを意識したマルチホップ推論を必要とする。
製品計画、開発、サポートステージをまたいだビジネスをシミュレートする合成データパイプラインを使用して構築します。
論文 参考訳(メタデータ) (2025-06-29T08:34:59Z) - AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z) - Search Wisely: Mitigating Sub-optimal Agentic Searches By Reducing Uncertainty [21.96443267949563]
エージェント検索型Augmented Generation (RAG) システムは,動的かつ多段階の推論と情報検索を可能にし,Large Language Models (LLM) を強化する。
これらのシステムは、オーバーサーチ(冗長な情報を取得する)やアンダーサーチ(必要な情報を取得するのに失敗する)のような準最適探索行動を示すことが多い。
この研究は、これらの振る舞いを公式に定義し、定量化し、複数のQAデータセットとエージェントRAGシステムにまたがるそれらの頻度を明らかにする。
論文 参考訳(メタデータ) (2025-05-22T20:57:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。