論文の概要: Team of Thoughts: Efficient Test-time Scaling of Agentic Systems through Orchestrated Tool Calling
- arxiv url: http://arxiv.org/abs/2602.16485v1
- Date: Wed, 18 Feb 2026 14:19:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.61084
- Title: Team of Thoughts: Efficient Test-time Scaling of Agentic Systems through Orchestrated Tool Calling
- Title(参考訳): 思考のチーム: オーケストレーションツール呼び出しによるエージェントシステムの効率的なテストタイムスケーリング
- Authors: Jeffrey T. H. Wong, Zixi Zhang, Junyi Liu, Yiren Zhao,
- Abstract要約: オーケストレータ・ツール・パラダイムによる異種エージェントの補完機能を活用した,新しいマルチエージェントシステム(MAS)であるTeam-of-Thoughtsを紹介する。
本フレームワークでは,(1)コーディネート能力の優れたモデルを特定するオーケストレータキャリブレーション方式,(2)自己評価プロトコルという,パフォーマンスを最適化する2つの重要なメカニズムを導入している。
5つの推論とコード生成ベンチマークの実験は、Team-of-Thoughtsが一貫して優れたタスクパフォーマンスを提供することを示している。
- 参考スコア(独自算出の注目度): 11.13437934037871
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing Multi-Agent Systems (MAS) typically rely on static, homogeneous model configurations, limiting their ability to exploit the distinct strengths of differently post-trained models. To address this, we introduce Team-of-Thoughts, a novel MAS architecture that leverages the complementary capabilities of heterogeneous agents via an orchestrator-tool paradigm. Our framework introduces two key mechanisms to optimize performance: (1) an orchestrator calibration scheme that identifies models with superior coordination capabilities, and (2) a self-assessment protocol where tool agents profile their own domain expertise to account for variations in post-training skills. During inference, the orchestrator dynamically activates the most suitable tool agents based on these proficiency profiles. Experiments on five reasoning and code generation benchmarks show that Team-of-Thoughts delivers consistently superior task performance. Notably, on AIME24 and LiveCodeBench, our approach achieves accuracies of 96.67% and 72.53%, respectively, substantially outperforming homogeneous role-play baselines, which score 80% and 65.93%.
- Abstract(参考訳): 既存のマルチエージェントシステム(MAS)は、静的で均質なモデル構成に依存しており、異なる訓練後のモデルの異なる強みを利用する能力を制限する。
これを解決するために,オーケストレータ・ツール・パラダイムを通じて異種エージェントの補完機能を活用する新しいMASアーキテクチャであるTeam-of-Thoughtsを紹介した。
本フレームワークでは,(1)調整能力の優れたモデルを特定するオーケストレータキャリブレーション方式,(2)学習後スキルの変化を考慮に入れた自己評価プロトコルを提案する。
推論中、オーケストレータはこれらの熟練度プロファイルに基づいて最適なツールエージェントを動的に活性化する。
5つの推論とコード生成ベンチマークの実験は、Team-of-Thoughtsが一貫して優れたタスクパフォーマンスを提供することを示している。
特に, AIME24 と LiveCodeBench では, それぞれ96.67% と 72.53% のアキュラシーを達成し, 80% と 65.93% と等質なロールプレイベースラインを大幅に上回っている。
関連論文リスト
- MAS-Orchestra: Understanding and Improving Multi-Agent Reasoning Through Holistic Orchestration and Controlled Benchmarks [86.05918381895555]
関数呼び出し強化学習問題としてMASオーケストレーションを定式化する訓練時間フレームワークとしてMASOrchestraを提案する。
MAS-Orchestraでは、複雑なゴール指向のサブエージェントは呼び出し可能な関数として抽象化され、システム構造に対する大域的推論を可能にする。
分析の結果,MASはタスク構造や検証プロトコル,オーケストレータとサブエージェントの両方の機能に大きく依存していることが判明した。
論文 参考訳(メタデータ) (2026-01-21T04:57:02Z) - Towards a Science of Scaling Agent Systems [79.64446272302287]
エージェント評価の定義を定式化し,エージェント量,コーディネーション構造,モデル,タスク特性の相互作用として,スケーリング法則を特徴付ける。
協調指標を用いて予測モデルを導出し,R2=0をクロスバリデーションし,未知のタスク領域の予測を可能にする。
ツールコーディネーショントレードオフ: 固定的な計算予算の下では, ツールヘビータスクはマルチエージェントのオーバーヘッドから不均衡に悩まされ, 2) 能力飽和: 調整が減少または負のリターンを, 単一エージェントのベースラインが45%を超えると達成できる。
論文 参考訳(メタデータ) (2025-12-09T06:52:21Z) - Structured Uncertainty guided Clarification for LLM Agents [126.26213027785813]
LLMエージェントは、ツールコール機能を備えた大きな言語モデルを拡張するが、曖昧なユーザ命令は、しばしば誤った呼び出しやタスクの失敗につながる。
本稿では,ツールコールパラメータに対する構造的不確かさの定式化,完全情報の期待値(EVPI)を目標としたPOMDPのモデル化,冗長性防止のためのアスペクトベースコストモデルを提案する。
我々のSAGE-Agentは、この構造化された不確実性を活用し、より優れた効率を達成するために、曖昧なタスクのカバレッジを7~39%増加させ、明確な質問を1.5~2.7$times$に減らした。
論文 参考訳(メタデータ) (2025-11-11T21:50:44Z) - Scaling Agents via Continual Pre-training [80.97989245493326]
我々は,エージェント連続事前学習(Agentic CPT)を深層研究エージェント訓練パイプラインに組み込んで,強力なエージェント基礎モデルを構築することを提案する。
我々は,AgentFounder-30Bを10のベンチマークで評価し,強力なツール使用能力を保ちながら最先端のパフォーマンスを実現した。
論文 参考訳(メタデータ) (2025-09-16T17:57:19Z) - Neural Orchestration for Multi-Agent Systems: A Deep Learning Framework for Optimal Agent Selection in Multi-Domain Task Environments [0.4640835690336653]
マルチドメインタスク環境における最適なエージェント選択のためのニューラルネットワークフレームワークであるMetaOrchを提案する。
ファジィ評価モジュールは、完全性、妥当性、信頼度に沿ってエージェント応答をスコアし、オーケストレータを訓練するためのソフトインスペクタラベルを生成する。
異種剤を用いた模擬環境実験により, 提案手法が86.3%の選択精度を達成できた。
論文 参考訳(メタデータ) (2025-05-03T02:58:25Z) - MorphAgent: Empowering Agents through Self-Evolving Profiles and Decentralized Collaboration [11.01813164951313]
本稿では,新しい自律型・自己組織化型・適応型多エージェントシステムであるMorphAgentを紹介する。
このアプローチでは,3つの主要な指標を通じて最適化された自己進化エージェントプロファイルを採用し,エージェントが個々の専門知識を磨き直す。
実験の結果,MorphAgentはタスク性能や要求の変化に対する適応性という点で,既存のフレームワークよりも優れていた。
論文 参考訳(メタデータ) (2024-10-19T09:10:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。