論文の概要: Share More, Search Less: Collaborative Parallel Thinking for Efficient Test-Time Scaling
- arxiv url: http://arxiv.org/abs/2605.27030v1
- Date: Tue, 26 May 2026 13:52:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.199267
- Title: Share More, Search Less: Collaborative Parallel Thinking for Efficient Test-Time Scaling
- Title(参考訳): より共有し、より少ない検索: 効率的なテスト時間スケーリングのための協調的並列思考
- Authors: Xinglin Wang, Hao Lin, Shaoxiong Feng, Peiwen Yuan, Yiwei Li, Jiayi Shi, Yueqi Zhang, Chuyi Tan, Ji Zhang, Boyuan Pan, Yao Hu, Kan Li,
- Abstract要約: 並列ブランチ間の探索時間情報共有を可能にするトレーニングフリー推論フレームワークである textbfCollaborative Parallel Thinking (CPT) を提案する。
CPTは、進行中のブランチからコンパクトな中間情報を抽出し、重複したクエリレベルの情報プールを保持し、入力コンテキストを通じてプールエントリをブロードキャストする。
実験により、CPTはロールアウト予算とモデルスケールをまたいで、強力なベースラインよりも高い精度-レイテンシフロンティアを確立することが示された。
- 参考スコア(独自算出の注目度): 38.12562387226678
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Test-Time Scaling (TTS) enhances the reasoning capabilities of large language models by allocating additional inference compute to explore the solution space. However, existing parallel TTS methods typically keep branches isolated during search: intermediate discoveries remain branch-private and cannot guide other branches in time. This information isolation causes substantial redundant exploration, as branches repeatedly rediscover information already found elsewhere and require more search steps to collect complete decision information needed to reach correct answers. To bridge this gap, we propose \textbf{Collaborative Parallel Thinking (CPT)}, a training-free inference framework that enables search-time information sharing across parallel branches. CPT extracts compact intermediate information from ongoing branches, maintains a deduplicated query-level information pool, and broadcasts pool entries through the input context, allowing each branch in subsequent search steps to reuse discoveries made by other branches rather than rediscover the same information. Empirically, experiments on HMMT and AIME benchmarks show that CPT establishes a stronger accuracy--latency Pareto frontier than strong baselines across rollout budgets and model scales, highlighting search-time collaboration as an effective direction for efficient parallel TTS.
- Abstract(参考訳): テスト時間スケーリング(TTS)は、ソリューション空間を探索するために追加の推論計算を割り当てることで、大規模言語モデルの推論能力を高める。
しかしながら、既存の並列TSメソッドは、通常、探索中に分岐を分離し続ける:中間的な発見は分岐プライベートのままであり、時間内に他の分岐を導くことはできない。
この情報分離は、他の場所で見つかった情報を繰り返し再発見し、正しい答えに到達するのに必要な完全な決定情報を集めるためにより多くの探索手順を必要とするため、かなりの冗長な探索を引き起こす。
このギャップを埋めるために、並列ブランチ間の検索時間情報共有を可能にするトレーニング不要な推論フレームワークである \textbf{Collaborative Parallel Thinking (CPT) を提案する。
CPTは、進行中のブランチからコンパクトな中間情報を抽出し、重複したクエリレベル情報プールを維持し、入力コンテキストを通じてプールエントリをブロードキャストする。
HMMTとAIMEベンチマークの実験では、CPTはロールアウト予算とモデルスケールにわたる強力なベースラインよりも高い精度のParetoフロンティアを確立し、効率的な並列TSのための効果的な方向として検索時間協調を強調している。
関連論文リスト
- TMAS: Scaling Test-Time Compute via Multi-Agent Synergy [17.644613845744388]
テストタイムスケーリングは、大規模言語モデルの推論能力を改善するための効果的なパラダイムとなっている。
マルチエージェント・シナジーによるテスト時間計算のスケーリングを行うフレームワークであるTMASを提案する。
TMASが既存のテスト時間スケーリングベースラインよりも強力な反復スケーリングを実現していることを示す。
論文 参考訳(メタデータ) (2026-05-11T10:44:10Z) - Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction [127.64173950476702]
エージェントが直接、汎用端末ツールを用いて、生コーパスを直接検索する直接コーパス間相互作用(DCI)について検討する。
このアプローチではオフラインインデックスを必要とせず、ローカルコーパスの進化に自然に適応する。
IRベンチマークとエンドツーエンドのエージェント検索タスク全体にわたって、この単純なセットアップは、強いスパース、密度、リランクベースラインよりも大幅に優れています。
論文 参考訳(メタデータ) (2026-05-03T19:13:11Z) - FastLane: Efficient Routed Systems for Late-Interaction Retrieval [58.060096779432094]
FastLaneは、クエリを最も情報的な表現に動的にルーティングする新しい検索フレームワークである。
Approximate Nearest Neighbor Search (ANNS)で遅延処理モデルをブリッジすることで、FastLaneはスケーラブルで低レイテンシな検索を可能にする。
論文 参考訳(メタデータ) (2026-01-10T02:22:01Z) - ParallelSearch: Train your LLMs to Decompose Query and Search Sub-queries in Parallel with Reinforcement Learning [20.11646932754985]
Reasoning-augmented search agent as Search-R1は、外部知識ソースからの多段階情報検索において顕著な能力を示す。
既存のアプローチは、本質的に並列化可能で論理的に独立な比較を扱う場合でも、検索クエリを厳格に処理する。
並列化可能なクエリ構造を認識し,複数の検索操作を同時に実行する,大規模言語モデルを活用した新しい強化学習フレームワークであるParallelSearchを提案する。
論文 参考訳(メタデータ) (2025-08-12T19:38:21Z) - Holistically Guided Monte Carlo Tree Search for Intricate Information Seeking [118.3983437282541]
我々は,モンテカルロ木探索 (HG-MCTS) を用いた新たな情報探索パラダイムを採用したLLMベースの検索アシスタントを提案する。
本稿では,知識メモリを用いたプログレッシブ情報収集プロセスとしてタスクを再構築し,適応型チェックリストとMCTSのマルチパースペクティブ報酬モデルとを結合する。
マルチパースペクティブ報酬モデリングは、探索と検索の両方の報奨と、完了と残るサブゴールを追跡する進捗フィードバックを提供する。
論文 参考訳(メタデータ) (2025-02-07T08:36:39Z) - Building Interpretable and Reliable Open Information Retriever for New
Domains Overnight [67.03842581848299]
情報検索は、オープンドメイン質問応答(QA)など、多くのダウンストリームタスクにとって重要な要素である。
本稿では、エンティティ/イベントリンクモデルとクエリ分解モデルを用いて、クエリの異なる情報単位により正確にフォーカスする情報検索パイプラインを提案する。
より解釈可能で信頼性が高いが,提案したパイプラインは,5つのIRおよびQAベンチマークにおける通過カバレッジと記述精度を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-09T07:47:17Z) - Exploring Complicated Search Spaces with Interleaving-Free Sampling [127.07551427957362]
本稿では,長距離接続を伴う複雑な検索空間上に探索アルゴリズムを構築する。
我々はtextbfIF-NAS という単純なアルゴリズムを提案し、異なるサブネットワークを構築するために周期的なサンプリング戦略を実行する。
提案した探索空間において、IF-NASはランダムサンプリングと従来の重み付け検索のアルゴリズムを有意差で上回っている。
論文 参考訳(メタデータ) (2021-12-05T06:42:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。