論文の概要: Beyond Parallel Sampling: Diverse Query Initialization for Agentic Search
- arxiv url: http://arxiv.org/abs/2606.17209v1
- Date: Mon, 15 Jun 2026 18:48:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.107218
- Title: Beyond Parallel Sampling: Diverse Query Initialization for Agentic Search
- Title(参考訳): 並列サンプリングを超えて: エージェント検索のための逆クエリ初期化
- Authors: Sidhaarth Murali, João Coelho, Jingjie Ning, João Magalhães, Bruno Martins, Chenyan Xiong,
- Abstract要約: 我々は、標準並列サンプリングはリターンを減少させ、これを最初のターンで冗長性を求めるためにトレースすることを示した。
この制限に対処するため、最初のターンでトレーニングなしの介入であるDivinitを使います。
5つのオープンウェイトモデルと8つのベンチマークで、Divinitは標準の並列サンプリングよりも一貫して改善されている。
- 参考スコア(独自算出の注目度): 25.819411424144736
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Test-time scaling for agentic search typically increases depth (i.e., more turns and tokens per trajectory) or breadth (i.e., more parallel rollouts). Here we focus on breadth scaling, showing that standard parallel sampling yields diminishing returns, tracing this to query redundancy at the first turn. When models issue similar first queries across rollouts, the threads retrieve overlapping evidence, and subsequent turns are conditioned on this shared retrieval. We address this limitation with DivInit, a training-free intervention at the first turn. Rather than sampling k independent first queries, DivInit draws n candidates from a single call, picks k < n diverse seeds, and runs them as parallel trajectories. Across five open-weight models and eight benchmarks, DivInit consistently improves over standard parallel sampling, with average gains of five to seven points on multi-hop QA at matched compute. Code available at https://github.com/cxcscmu/diverse-query-initialization
- Abstract(参考訳): エージェント検索のテストタイムスケーリングは、一般的に深さ(軌道毎の回転数やトークン数)や幅(より平行なロールアウト数)を増大させる。
ここでは、幅のスケーリングに注目し、標準並列サンプリングがリターンを減少させ、これを最初のターンでクエリ冗長性にトレースすることを示す。
モデルがロールアウトにまたがる同様の最初のクエリを発行すると、スレッドは重複するエビデンスを検索し、その後のターンはこの共有検索に条件付けされる。
この制限に対処するため、最初のターンでトレーニングなしの介入であるDivinitを使います。
k個の独立した最初のクエリをサンプリングする代わりに、Divinitは単一の呼び出しからn個の候補を抽出し、k < n個の種を選択し、それらを並列なトラジェクトリとして実行する。
5つのオープンウェイトモデルと8つのベンチマークで、Divinitは標準の並列サンプリングよりも一貫して改善されており、一致した計算におけるマルチホップQAの平均利得は5から7ポイントである。
https://github.com/cxcscmu/diverse-query-initialization
関連論文リスト
- Subtraction Gets You More: Gap-Aware Retrieval for Multimodal Multi-Hop QA [11.316299961548415]
本稿では,埋め込みレベルで直接暗黙的なクエリ書き換えを行うパラダイムを提案する。
コンテクスト・サブトラクティブなクエリ・ステアリングにより、GRAILはコンストラクショナル・クロスモーダルな推論において優れている。
タスクタイプに基づいたクエリを動的にルーティングすることで、MultimodalQA上で40.3%のマクロ平均パフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2026-05-27T15:46:21Z) - Scaling Test-Time Compute for Agentic Coding [126.72747643609274]
本稿では,ロールアウト軌跡のコンパクトな表現に基づくエージェントコーディングのためのテスト時間スケーリングフレームワークを提案する。
当社のフレームワークは,各ロールアウトを,その健全な仮説,進捗,障害モードを保存する構造的な要約に変換する。
提案手法は,SWE-Bench Verified および Terminal-Bench v2.0 におけるフロンティア符号化エージェントの性能を一貫して改善する。
論文 参考訳(メタデータ) (2026-04-16T17:39:33Z) - Understanding Performance Gap Between Parallel and Sequential Sampling in Large Reasoning Models [22.43427076561539]
大規模推論モデル(LRM)は、数学やコーディングといった難しい問題に対して顕著なパフォーマンスを示している。
より複雑なプロセスを形成するために構成できるサンプリング戦略は、シーケンシャルサンプリングと並列サンプリングの2つがある。
本稿では,これら2つの手法を厳密に比較し,並列サンプリングが逐次サンプリングより優れていることを示す。
論文 参考訳(メタデータ) (2026-04-07T13:28:09Z) - Parallel Sampling via Autospeculation [13.643401888306398]
我々は,任意の順序の自己回帰モデルと拡散モデルという2つの設定において,サンプリングを高速化するアルゴリズムを提案する。
オラクルコールを並列に発行することで、期待されるサンプリング時間を$widetildeO(n1/2)$に削減できることを示す。
我々は投機的拒絶サンプリングという新しい手法を導入する。
論文 参考訳(メタデータ) (2025-11-11T06:09:44Z) - Generalized Parallel Scaling with Interdependent Generations [58.43994876504917]
本稿では,相互依存応答を並列に生成するブリッジを提案する。
少数の新しいパラメータしか持たず、ブリッジは強化学習による相対平均精度の向上を図っている。
論文 参考訳(メタデータ) (2025-10-01T17:33:35Z) - Parallel-R1: Towards Parallel Thinking via Reinforcement Learning [65.68667585027232]
並列思考は、大規模言語モデルの推論能力を高めるための新しいアプローチである。
並列思考行動を可能にする最初の強化学習フレームワークである textbfParallel-R1 を提案する。
本フレームワークでは,並列思考のトレーニングにおいて,コールドスタート問題に明示的に対処する漸進的なカリキュラムを採用している。
論文 参考訳(メタデータ) (2025-09-09T17:59:35Z) - Hybrid Deep Searcher: Integrating Parallel and Sequential Search Reasoning [57.78245296980122]
本稿では,自然質問から自動生成されるデータセットであるHDS-QA(Hybrid Deep Search QA)を紹介する。
並列化可能な独立サブクエリ(同時に実行可能)と逐次依存サブクエリ(ステップバイステップの解決を必要とする)を組み合わせたハイブリッドホップ質問を含む。
モデルの名称はHybridDeepSearcherで、複数のベンチマークで最先端のベースラインを上回っています。
論文 参考訳(メタデータ) (2025-08-26T15:15:17Z) - Non-Adaptive Adaptive Sampling on Turnstile Streams [57.619901304728366]
カラムサブセット選択、部分空間近似、射影クラスタリング、および空間サブリニアを$n$で使用するターンタイルストリームのボリュームに対する最初の相対エラーアルゴリズムを提供する。
我々の適応的なサンプリング手法は、様々なデータ要約問題に多くの応用をもたらしており、これは最先端を改善するか、より緩和された行列列モデルで以前に研究されただけである。
論文 参考訳(メタデータ) (2020-04-23T05:00:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。