論文の概要: A Picture of Agentic Search
- arxiv url: http://arxiv.org/abs/2602.17518v1
- Date: Thu, 19 Feb 2026 16:32:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:29.210301
- Title: A Picture of Agentic Search
- Title(参考訳): エージェント検索の画像
- Authors: Francesca Pezzuti, Ophir Frieder, Fabrizio Silvestri, Sean MacAvaney, Nicola Tonellotto,
- Abstract要約: 情報検索は、もはや実施されていない仮定の下で行われる。
適応がなければ、検索モデルは人間も新規のユーザーセグメントも満たさない。
本研究では,エージェント検索拡張システムによって生成・消費されるすべてのデータを収集する手法を開発する。
- 参考スコア(独自算出の注目度): 32.93760518790612
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With automated systems increasingly issuing search queries alongside humans, Information Retrieval (IR) faces a major shift. Yet IR remains human-centred, with systems, evaluation metrics, user models, and datasets designed around human queries and behaviours. Consequently, IR operates under assumptions that no longer hold in practice, with changes to workload volumes, predictability, and querying behaviours. This misalignment affects system performance and optimisation: caching may lose effectiveness, query pre-processing may add overhead without improving results, and standard metrics may mismeasure satisfaction. Without adaptation, retrieval models risk satisfying neither humans, nor the emerging user segment of agents. However, datasets capturing agent search behaviour are lacking, which is a critical gap given IR's historical reliance on data-driven evaluation and optimisation. We develop a methodology for collecting all the data produced and consumed by agentic retrieval-augmented systems when answering queries, and we release the Agentic Search Queryset (ASQ) dataset. ASQ contains reasoning-induced queries, retrieved documents, and thoughts for queries in HotpotQA, Researchy Questions, and MS MARCO, for 3 diverse agents and 2 retrieval pipelines. The accompanying toolkit enables ASQ to be extended to new agents, retrievers, and datasets.
- Abstract(参考訳): 自動システムが人間と一緒に検索クエリを発行するようになり、Information Retrieval(IR)は大きな変化に直面している。
しかし、IRは人間中心のままであり、システム、評価指標、ユーザーモデル、人間のクエリや振る舞いを中心に設計されたデータセットがある。
その結果、IRは、ワークロードのボリューム、予測可能性、クエリ動作の変更とともに、実際には保持されない仮定の下で動作します。
キャッシュは効率を損なう可能性があり、クエリ前処理は結果を改善することなくオーバーヘッドを増し、標準メトリクスは満足度を間違える可能性がある。
適応がなければ、検索モデルは人間も新規のユーザーセグメントも満たさない。
しかし、エージェント探索動作をキャプチャするデータセットは不足しており、IRがデータ駆動評価と最適化に歴史的に依存していることを考えると、これは重要なギャップである。
我々は,クエリに応答するエージェント検索拡張システムによって生成・消費されるすべてのデータを収集する手法を開発し,エージェント検索クエリセット(ASQ)データセットをリリースする。
ASQには3つの多様なエージェントと2つの検索パイプラインのためのHotpotQA、Researchy Questions、MS MARCOでの推論によるクエリ、検索されたドキュメント、およびクエリに対する思考が含まれている。
付属するツールキットにより、ASQを新しいエージェント、レトリバー、データセットに拡張することができる。
関連論文リスト
- SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback [68.60326181052658]
本稿では,高品質で難易度の高い探索問合せを自動生成するエージェントパイプラインを提案する。
我々のパイプラインであるSAGEは、QAペアを提案するデータジェネレータと、生成された質問を解決するための検索エージェントで構成される。
我々の本質的な評価は、SAGEが様々な推論戦略を必要とする質問を生成する一方で、生成したデータの正確性や難易度を著しく高めていることを示している。
論文 参考訳(メタデータ) (2026-01-26T06:37:56Z) - Query Suggestion for Retrieval-Augmented Generation via Dynamic In-Context Learning [42.850404278428954]
我々は、関連するユーザクエリからサンプルを検索する頑健な動的数ショット学習を導入する。
本研究では,例えば事前のユーザクエリでは自己学習が可能であり,実際に容易に適用可能であることを示す。
論文 参考訳(メタデータ) (2026-01-13T00:56:38Z) - Supporting Our AI Overlords: Redesigning Data Systems to be Agent-First [72.85721148326138]
大規模言語モデル(LLM)エージェントは、将来、データシステムの主要なワークロードになる可能性が高い。
エージェントの推測は、現在のデータシステムに課題をもたらす可能性がある。
我々は,新しいエージェントファーストデータシステムアーキテクチャの新たな研究機会について概説する。
論文 参考訳(メタデータ) (2025-08-31T21:19:40Z) - Am I on the Right Track? What Can Predicted Query Performance Tell Us about the Search Behaviour of Agentic RAG [35.16209722320604]
本稿では,最近のエージェントRAGモデル検索-R1とR1-Searcherにおけるクエリ性能予測(QPP)の適用性について検討する。
より短い推理過程において,有効解答器を適用すれば高い解答精度が得られることがわかった。
論文 参考訳(メタデータ) (2025-07-14T15:54:50Z) - InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation [63.55258191625131]
InfoDeepSeekは、現実世界の動的Web環境でエージェント情報を求めるための新しいベンチマークである。
本稿では,決定性,難易度,多様性の基準を満たす課題クエリを構築するための体系的手法を提案する。
本研究では,情報探索結果の正確性,有用性,コンパクト性に関する詳細な指標を含む,動的エージェント情報探索に適した最初の評価フレームワークを開発する。
論文 参考訳(メタデータ) (2025-05-21T14:44:40Z) - Unsupervised Query Routing for Retrieval Augmented Generation [64.47987041500966]
本稿では,検索強化応答の質を評価するために,"upper-bound"応答を構成する新しい教師なし手法を提案する。
この評価により、与えられたクエリに対して最も適切な検索エンジンを決定することができる。
手動のアノテーションをなくすことで、大規模なユーザクエリを自動的に処理し、トレーニングデータを作成することができる。
論文 参考訳(メタデータ) (2025-01-14T02:27:06Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。