論文の概要: Dr-DCI: Scaling Direct Corpus Interaction via Dynamic Workspace Expansion
- arxiv url: http://arxiv.org/abs/2606.14885v1
- Date: Fri, 12 Jun 2026 18:46:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.440382
- Title: Dr-DCI: Scaling Direct Corpus Interaction via Dynamic Workspace Expansion
- Title(参考訳): Dr-DCI:動的ワークスペース拡張による直接コーパスインタラクションのスケーリング
- Authors: Yi Lu, Zhuofeng Li, Ping Nie, Haoxiang Zhang, Yuyu Zhang, Kai Zou, Wenhu Chen, Jimmy Lin, Dongfu Jiang, Yu Zhang,
- Abstract要約: DR-DCIは、検索をローカルなワークスペースを拡張するためのエージェントコール可能なアクションとして扱う、レトリバーによるDCIフレームワークである。
DR-DCIはスケールにわたって効果的かつ効率的であることを示す。
コーパススケーリング実験では、DR-DCIは1万文書から10万文書まで有効であり、生のDCIは不安定になり、BM25は著しく悪化する。
- 参考スコア(独自算出の注目度): 76.02214947070392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic search over large corpora relies on retriever-mediated interfaces (e.g., BM25 or ColBERT) for scalable candidate discovery. While effective at ranking relevant documents, these interfaces expose evidence only as ranked results or bounded document views, limiting agents' ability to reorganize material and verify constraints across documents. Direct Corpus Interaction (DCI) addresses this limitation by exposing shell-executable corpus operations for flexible search, filtering, comparison, and verification. However, full-corpus terminal commands become slow and unstable as the corpus grows, degrading performance and efficiency. We introduce DR-DCI, a retriever-steered DCI framework that treats retrieval as an agent-callable action for expanding a local workspace. Rather than operating directly over the full corpus, the agent dynamically pulls relevant documents into an evolving workspace and conducts DCI operations within it. This design combines retriever-level recall with DCI-style precision: retrieval keeps exploration scalable, while DCI preserves the local operations needed for effective evidence resolution. Experiments show that DR-DCI is both effective and efficient across scales. On Browsecomp-Plus, DR-DCI reaches 71.2\% accuracy, improving over raw DCI and ablated variants by up to 8.3 points while reducing tool usage, wall time, and estimated cost. With workspace-preserving context reset, accuracy further improves to 73.3\%. In corpus-scaling experiments, DR-DCI remains effective from 100K to 10M documents, whereas raw DCI becomes unstable and BM25 performs substantially worse. DR-DCI also scales to a 20M-scale file-per-document Wiki-18 QA setting, achieving an average score of 63.0 across six benchmarks and outperforming retrieval-based and trained search-agent baselines. Ablation analysis further shows that ranked previews and inter-document DCI are key to performance.
- Abstract(参考訳): 大規模コーパス上のエージェントサーチは、スケーラブルな候補発見のためにレトリバーによるインタフェース(BM25やColBERTなど)に依存している。
関連文書のランク付けには有効であるが、これらのインターフェースは、資料を再編成し、文書間の制約を検証するエージェントの能力を制限する、ランク付けされた結果または境界文書ビューとしてのみエビデンスを公開する。
直接コーパスインタラクション(DCI)は、フレキシブル検索、フィルタリング、比較、検証のためにシェル実行可能なコーパス操作を公開することで、この制限に対処する。
しかし、コーパスが大きくなるにつれて、フルコーパス端末コマンドは遅く不安定になり、性能と効率が低下する。
本稿では,検索をエージェントコール可能なアクションとして扱うDCIフレームワークDR-DCIを紹介する。
エージェントは、全コーパスを直接操作する代わりに、関連するドキュメントを動的に進化するワークスペースに引き込み、内部でDCI操作を実行する。
この設計は、レトリバーレベルのリコールとDCIスタイルの精度を組み合わせる。
実験により、DR-DCIはスケールにわたって効果的かつ効率的であることが示されている。
Browsecomp-Plusでは、DR-DCIは71.2\%の精度に達し、生のDCIよりも改善され、ツールの使用量、壁時間、推定コストを最大8.3ポイント削減した。
ワークスペース保存コンテキストリセットにより、精度はさらに73.3\%向上する。
コーパススケーリング実験では、DR-DCIは1万文書から10万文書まで有効であり、生のDCIは不安定になり、BM25は著しく悪化する。
DR-DCIはまた、ドキュメント毎の20MスケールのWiki-18 QA設定までスケールし、6つのベンチマークで平均スコアが63.0に達し、検索ベースとトレーニングされた検索エージェントベースラインを上回っている。
アブレーション分析により、ランク付けされたプレビューとドキュメント間DCIがパフォーマンスの鍵であることが示される。
関連論文リスト
- Towards Retrieving Interaction Spaces for Agentic Search [62.666902610940525]
最近の直接コーパス(DCI)の研究は、エージェントが5.4のインタラクションやファイル読み取りといったシェルツールを通じて生コーパスと対話できることを示している。
エージェント検索における検索の役割は, LLMコンテキストウィンドウに適合する文書を選択することだけではなく, インタラクション空間を構築することにある。
論文 参考訳(メタデータ) (2026-06-05T03:47:40Z) - GrepSeek: Training Search Agents for Direct Corpus Interaction [66.69568141699311]
GrepSeekは、コンパクトな検索エージェントを訓練し、大きなテキストコーパスから証拠を見つけ、フィルタリングし、構成する、最適化された直接コーパスインタラクション(DCI)検索エージェントである。
DCIを大規模に実用化するためには、シェルコマンドのシーケンシャルな実行とバイトエクササイズ等価性を保ちながら、シェルベースの検索を最大7.6タイムで高速化するセマンティックス保存のシャード並列実行エンジンを使用する。
論文 参考訳(メタデータ) (2026-05-28T03:37:33Z) - LongSeeker: Elastic Context Orchestration for Long-Horizon Search Agents [63.75550089045995]
ロングホライズン検索エージェントは、理由として急速に成長する作業状況を管理し、ツールを呼び、情報を観察しなければならない。
エージェントの軌道の一部は、タスクに対する現在の関連性に応じて、異なるレベルで細部まで維持される。
我々は10kの合成軌道上にQwen3-30B-A3Bを微調整した長距離探索エージェントであるLongSeekerを開発した。
論文 参考訳(メタデータ) (2026-05-06T17:54:16Z) - Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - Structured Cognitive Loop for Behavioral Intelligence in Large Language Model Agents [0.0]
既存のフレームワークは認知、記憶、制御をひとつのプロンプトで混ぜることが多く、一貫性と予測可能性を減らす。
構造化認知ループ (Structured Cognitive Loop, SCL) は、これらの機能を分離する代替アーキテクチャとして提案されている。
SCLの平均タスク成功率は86.3%であり、ベースラインは70.5から76.8%である。
論文 参考訳(メタデータ) (2025-09-23T17:43:17Z) - BrowseComp-Plus: A More Fair and Transparent Evaluation Benchmark of Deep-Research Agent [74.10138164281618]
BrowseComp-Plus(BrowseComp-Plus)は、BrowseCompから派生したベンチマークである。
このベンチマークは、ディープリサーチエージェントと検索方法の総合的な評価とアンタングル解析を可能にする。
論文 参考訳(メタデータ) (2025-08-08T17:55:11Z) - Corrective Retrieval Augmented Generation [36.04062963574603]
Retrieval-augmented Generation (RAG) は、検索された文書の関連性に大きく依存しており、検索が失敗した場合のモデルがどのように振る舞うかについての懸念を提起する。
生成の堅牢性を改善するために,CRAG(Corrective Retrieval Augmented Generation)を提案する。
CRAGはプラグアンドプレイであり、様々なRAGベースのアプローチとシームレスに結合できる。
論文 参考訳(メタデータ) (2024-01-29T04:36:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。