論文の概要: Towards Retrieving Interaction Spaces for Agentic Search
- arxiv url: http://arxiv.org/abs/2606.06880v1
- Date: Fri, 05 Jun 2026 03:47:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.554065
- Title: Towards Retrieving Interaction Spaces for Agentic Search
- Title(参考訳): エージェント検索のためのインタラクション空間の検索に向けて
- Authors: Shengyao Zhuang, Yuansheng Ni, Hengxin Fun, Jimmy Lin, Xueguang Ma,
- Abstract要約: 最近の直接コーパス(DCI)の研究は、エージェントが5.4のインタラクションやファイル読み取りといったシェルツールを通じて生コーパスと対話できることを示している。
エージェント検索における検索の役割は, LLMコンテキストウィンドウに適合する文書を選択することだけではなく, インタラクション空間を構築することにある。
- 参考スコア(独自算出の注目度): 62.666902610940525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval for search agents is still inherited from non-agentic information retrieval: a retriever ranks the corpus and the agent reads a small set of returned documents. Recent direct corpus interaction (DCI) work shows that agents can instead interact with the raw corpus through shell tools such as grep and file reads. But unbounded interaction does not scale: every broad shell command is a scan over the whole corpus, and latency degrades sharply as the corpus grows. We argue that the role of retrieval for agentic search is not just to select documents that fit in the LLM context window, but to construct an interaction space: a bounded subset of the corpus the agent can explore with associated tools. Two design consequences follow. The space needs a boundary supplied by retrieval, and the objects within it should be processed for interaction. As a proof of concept, we propose RISE (Retrieving Interaction SpacE): we use BM25 to construct the interaction space; meanwhile, its documents are processed during indexing for shell-style navigation. On BrowseComp-Plus, RISE matches the pure-shell DCI baseline at 78% accuracy with gpt-5.4-mini at roughly one quarter of the per-query cost. At 1M documents, RISE-BM25 reaches 81% on gpt-5.4-mini, whereas DCI on gpt-5.4-nano degrades to 60% with 33 of 100 wall-clock failures.
- Abstract(参考訳): 検索エージェントの検索は、まだ非エージェント情報検索から受け継がれている。
最近の直接コーパス相互作用(DCI)の研究は、エージェントがグレップやファイル読み込みといったシェルツールを通じて、代わりに生コーパスと対話できることを示している。
すべてのワイドシェルコマンドはコーパス全体のスキャンであり、コーパスが大きくなるにつれてレイテンシが急激に低下する。
エージェント検索における検索の役割は, LLMコンテキストウィンドウに適合する文書を選択することだけではなく, 対話空間を構築することにある。
2つの設計結果が続く。
空間は検索によって供給される境界を必要とし、その内部のオブジェクトは相互作用のために処理されるべきである。
概念実証として RISE (Retrieving Interaction SpacE): BM25 を用いてインタラクション空間を構築し, シェルスタイルナビゲーションのインデックス作成中に文書を処理する。
BrowseComp-Plusでは、RISEは純殻のDCIベースラインを78%の精度でgpt-5.4-miniと、クエリあたりのコストの約4分の1で一致させる。
1Mの文書では、RISE-BM25はgpt-5.4-miniで81%に達し、gpt-5.4-nanoのDCIは壁時計100回中33回まで低下する。
関連論文リスト
- GrepSeek: Training Search Agents for Direct Corpus Interaction [66.69568141699311]
GrepSeekは、コンパクトな検索エージェントを訓練し、大きなテキストコーパスから証拠を見つけ、フィルタリングし、構成する、最適化された直接コーパスインタラクション(DCI)検索エージェントである。
DCIを大規模に実用化するためには、シェルコマンドのシーケンシャルな実行とバイトエクササイズ等価性を保ちながら、シェルベースの検索を最大7.6タイムで高速化するセマンティックス保存のシャード並列実行エンジンを使用する。
論文 参考訳(メタデータ) (2026-05-28T03:37:33Z) - Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - Don't Retrieve, Navigate: Distilling Enterprise Knowledge into Navigable Agent Skills for QA and RAG [7.558933130117637]
Corpus2Skillはドキュメントコーパスを階層的なスキルディレクトリにオフラインで蒸留する。
コンパイルパイプラインは、文書を反復的にクラスタリングし、各レベルでLCMで書かれた要約を生成し、ナビゲート可能なスキルファイルのツリーとして結果を実体化する。
サービス時には、エージェントは、コーパスの鳥眼ビューを受け取り、徐々に細かな要約を通してトピックブランチにドリルし、IDによって全文書を検索する。
論文 参考訳(メタデータ) (2026-04-16T03:05:37Z) - DeepRead: Document Structure-Aware Reasoning to Enhance Agentic Search [23.447631421934847]
DeepReadは、ドキュメントネイティブな構造的事前を動作可能な推論機能に運用するために設計された、構造対応のドキュメント推論エージェントである。
DeepReadは、従来の検索手法に固有のコンテキストの断片化を効果的に軽減する、人間のような位置読み取りの推論パラダイムを提供する。
論文 参考訳(メタデータ) (2026-02-04T20:03:28Z) - GeAR: Generation Augmented Retrieval [82.20696567697016]
本稿では,新しい方法であるtextbfGe$nerationを紹介する。
対照的な学習を通じて、グローバルなドキュメントクエリの類似性を改善すると同時に、よく設計されたフュージョンとデコードモジュールを統合する。
検索機として使用する場合、GeARはバイエンコーダよりも計算コストがかかることはない。
論文 参考訳(メタデータ) (2025-01-06T05:29:00Z) - DAPR: A Benchmark on Document-Aware Passage Retrieval [57.45793782107218]
我々は,このタスクemphDocument-Aware Passage Retrieval (DAPR)を提案する。
State-of-The-Art(SoTA)パスレトリバーのエラーを分析しながら、大きなエラー(53.5%)は文書コンテキストの欠如に起因する。
提案するベンチマークにより,検索システムの開発・比較を今後行うことができる。
論文 参考訳(メタデータ) (2023-05-23T10:39:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。