論文の概要: FutureWeaver: Planning Test-Time Compute for Multi-Agent Systems with Modularized Collaboration
- arxiv url: http://arxiv.org/abs/2512.11213v1
- Date: Fri, 12 Dec 2025 01:43:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.617429
- Title: FutureWeaver: Planning Test-Time Compute for Multi-Agent Systems with Modularized Collaboration
- Title(参考訳): FutureWeaver: モジュール化コラボレーションによるマルチエージェントシステムのテスト時間計算計画
- Authors: Dongwon Jung, Peng Shi, Yi Zhang,
- Abstract要約: 固定予算下でのマルチエージェントシステムにおけるテスト時間計算割り当ての計画と最適化のためのフレームワークを提案する。
FutureWeaverでは、現在のタスク状態を推論し、将来のステップを推測することで、計算割り当てを最適化する、デュアルレベルの計画アーキテクチャを採用している。
複雑なエージェントベンチマークの実験では、FutureWeaverはさまざまな予算設定で一貫してベースラインを上回っている。
- 参考スコア(独自算出の注目度): 12.658898793358766
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scaling test-time computation improves large language model performance without additional training. Recent work demonstrates that techniques such as repeated sampling, self-verification, and self-reflection can significantly enhance task success by allocating more inference-time compute. However, applying these techniques across multiple agents in a multi-agent system is difficult: there does not exist principled mechanisms to allocate compute to foster collaboration among agents, to extend test-time scaling to collaborative interactions, or to distribute compute across agents under explicit budget constraints. To address this gap, we propose FutureWeaver, a framework for planning and optimizing test-time compute allocation in multi-agent systems under fixed budgets. FutureWeaver introduces modularized collaboration, formalized as callable functions that encapsulate reusable multi-agent workflows. These modules are automatically derived through self-play reflection by abstracting recurring interaction patterns from past trajectories. Building on these modules, FutureWeaver employs a dual-level planning architecture that optimizes compute allocation by reasoning over the current task state while also speculating on future steps. Experiments on complex agent benchmarks demonstrate that FutureWeaver consistently outperforms baselines across diverse budget settings, validating its effectiveness for multi-agent collaboration in inference-time optimization.
- Abstract(参考訳): テスト時間計算のスケーリングは、追加のトレーニングなしで大きな言語モデルのパフォーマンスを向上させる。
最近の研究は、繰り返しサンプリング、自己検証、自己回帰といった手法が、より推論時間の計算を割り当てることでタスクの成功を著しく向上させることを示した。
エージェント間のコラボレーションを促進するために計算を割り当てたり、協調的なインタラクションにテストタイムのスケーリングを拡張したり、明示的な予算制約の下でエージェント間で計算を分散したりするための原則的なメカニズムは存在しない。
このギャップに対処するため,固定予算下でのマルチエージェントシステムにおけるテスト時間割当の計画と最適化を行うフレームワークであるFutureWeaverを提案する。
FutureWeaverでは,再利用可能なマルチエージェントワークフローをカプセル化したコール可能な関数として形式化されたモジュール化されたコラボレーションが導入されている。
これらのモジュールは、過去の軌道から繰り返し発生する相互作用パターンを抽象化することにより、自己再生反射によって自動的に引き起こされる。
これらのモジュール上に構築されているFutureWeaverでは、現在のタスク状態を推論し、将来のステップを推測することで、計算割り当てを最適化する、デュアルレベルの計画アーキテクチャを採用している。
複雑なエージェントベンチマークの実験では、FutureWeaverはさまざまな予算設定でベースラインを一貫して上回り、推論時最適化におけるマルチエージェントコラボレーションの有効性を検証する。
関連論文リスト
- Multi-Agent Tool-Integrated Policy Optimization [67.12841355267678]
大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクに対して、多ターンツール統合計画にますます依存している。
既存の実装は通常、単一のエージェントに依存するが、コンテキスト長とノイズの多いツールレスポンスに悩まされる。
ツール統合マルチエージェントフレームワークの効果的な強化学習をサポートする方法はない。
論文 参考訳(メタデータ) (2025-10-06T10:44:04Z) - InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.65914611521654]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。
InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文 参考訳(メタデータ) (2025-09-26T15:44:09Z) - AgentCompass: Towards Reliable Evaluation of Agentic Workflows in Production [4.031479494871582]
本稿では,エージェントパイプラインのデプロイ後監視と推論に特化して設計された,最初の評価フレームワークであるAgentを紹介する。
Agentは、主要なメトリクスに関する最先端の結果を達成すると同時に、人間のアノテーションで見逃された重要な問題を明らかにする。
論文 参考訳(メタデータ) (2025-09-18T05:59:04Z) - Agentic Predictor: Performance Prediction for Agentic Workflows via Multi-View Encoding [56.565200973244146]
Agentic Predictorは、効率的なエージェントワークフロー評価のための軽量な予測器である。
Agentic Predictorはタスク成功率の近似を学ぶことで、最適なエージェントワークフロー構成の迅速かつ正確な選択を可能にする。
論文 参考訳(メタデータ) (2025-05-26T09:46:50Z) - MAMM-Refine: A Recipe for Improving Faithfulness in Generation with Multi-Agent Collaboration [63.31211701741323]
我々はマルチエージェント・マルチモデル推論を生成にまで拡張し、特に改良による忠実度の向上を図っている。
我々は,各サブタスクに対して固有の評価を設計し,マルチエージェント(複数インスタンス)とマルチモデル(多変数LPMタイプ)の両方がエラー検出やクオリティクスに有効であることを示す。
我々はこれらの知見を、マルチエージェント・マルチモデル・リファインメント(MAMM-Refinement)と呼ばれる最終的な"レシピ"に統合し、マルチエージェント・マルチモデルコラボレーションがパフォーマンスを大幅に向上させる。
論文 参考訳(メタデータ) (2025-03-19T14:46:53Z) - PMM-Net: Single-stage Multi-agent Trajectory Prediction with Patching-based Embedding and Explicit Modal Modulation [6.793915571620126]
本稿では,マルチエージェント軌道予測フレームワークの定式化について検討する。
本稿では,パッチベースの時間的特徴抽出モジュールとグラフベースのソーシャル特徴抽出モジュールを提案する。
本稿では,時間的特徴と社会的特徴を統合し,効率的な単一ステージ推論パイプラインを構築するための,明示的なモダリティ変調に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-25T13:16:27Z) - Scaling Large Language Model-based Multi-Agent Collaboration [72.8998796426346]
近年の大規模言語モデル駆動型自律エージェントのブレークスルーにより、複数エージェントのコラボレーションが集団的推論を通じて各個人を上回ることが判明している。
本研究は、協調剤の連続的な添加が同様の利益をもたらすかどうかを考察する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。