論文の概要: Tool-RoCo: An Agent-as-Tool Self-organization Large Language Model Benchmark in Multi-robot Cooperation
- arxiv url: http://arxiv.org/abs/2511.21510v1
- Date: Wed, 26 Nov 2025 15:45:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-27 18:37:59.175051
- Title: Tool-RoCo: An Agent-as-Tool Self-organization Large Language Model Benchmark in Multi-robot Cooperation
- Title(参考訳): Tool-RoCo:マルチロボット協調におけるエージェント・アズ・ツール・自己組織化大言語モデルベンチマーク
- Authors: Ke Zhang, Xiaoning Zhao, Ce Zheng, Jiahong Ning, Dandan Zhu, Wenqi Zhang, Chen Sun, Toshiharu Sugawara,
- Abstract要約: 本研究では,大規模言語モデル(LLM)を長期的マルチエージェント協調で評価するための新しいベンチマークであるTool-RoCoを提案する。
Tool-RoCoは、他のエージェントをツールとして扱い、協調ツールを導入し、ツールの使用を利用してマルチエージェントの協力と自己組織化を評価する。
- 参考スコア(独自算出の注目度): 22.3749206046041
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study proposes Tool-RoCo, a novel benchmark for evaluating large language models (LLMs) in long-term multi-agent cooperation based on RoCo, a multi-robot cooperative benchmark. Recent research on LLM-based multi-agent systems has relied on predefined orchestration, while ignoring agent autonomy. Tool-RoCo treats other agents as tools and introduces cooperative tools, leveraging tool usage to evaluate multi-agent cooperation and self-organization. Tool usage means that each agent (LLM) selects a tool from a candidate set based on the current state, receives feedback, and adjusts its selection in subsequent rounds. To evaluate different autonomy levels, we propose four LLM paradigms: (1) centralized cooperation, where a single LLM allocates tools to all agents; (2) centralized self-organization, where a central LLM autonomously activates agents while keeping others inactive; (3) decentralized cooperation, where each agent has its own LLM and calls tools based on local information; and (4) self-organization, where a randomly chosen initial agent can request collaboration, activating additional agents via tool calls. Tool-RoCo includes three multi-robot tasks, SORT, PACK, and CABINET, to measure format and parameter accuracy and agent coordination through tool usage. The results using several LLMs showed that cooperative tools accounted for only 7.09% of all tools, indicating that LLM-based agents rarely invoked others as assistants. Moreover, activation tools accounted for 96.42%, suggesting that current LLMs tend to maintain active agents while seldom deactivating them for adaptive coordination. Tool-RoCo provides a systematic benchmark to evaluate LLM autonomy and cooperation in multi-agent tasks. Code and Demo: https://github.com/ColaZhang22/Tool-Roco
- Abstract(参考訳): 本研究は,大規模言語モデル(LLM)を複数ロボット協調ベンチマークであるRoCoに基づく長期マルチエージェント協調で評価するための新しいベンチマークであるTool-RoCoを提案する。
LLMベースのマルチエージェントシステムに関する最近の研究は、エージェントの自律性を無視しながら、事前に定義されたオーケストレーションに依存している。
Tool-RoCoは、他のエージェントをツールとして扱い、協調ツールを導入し、ツールの使用を利用してマルチエージェントの協力と自己組織化を評価する。
ツールの使用は、各エージェント(LLM)が現在の状態に基づいて候補セットからツールを選択し、フィードバックを受け取り、その後のラウンドでその選択を調整することを意味する。
1つのLLMが全てのエージェントにツールを割り当てる集中的協力、(2)中央のLLMが他のエージェントを不活性に保ちながらエージェントを自律的に活性化する集中的自己組織化、(3)各エージェントが独自のLLMを持ち、ローカル情報に基づいてツールを呼び出す分散的協力、(4)ランダムに選択された初期エージェントが協力を求め、ツールコールを介して追加エージェントを活性化する自己組織化。
Tool-RoCoには、SORT、PACK、CABINETという3つのマルチロボットタスクが含まれており、ツールの使用を通してフォーマットとパラメータの精度とエージェント調整を測定する。
複数のLSMを用いて行った結果、協力ツールがすべてのツールのわずか7.09%を占めており、LSMをベースとしたエージェントがアシスタントとして他者を呼び出すことは滅多にないことが示された。
さらに、アクティベーションツールは96.42%を占めており、現在のLSMは能動剤を維持し、適応調整のために非活性化することはめったにない。
Tool-RoCoは、マルチエージェントタスクにおけるLCMの自律性と協調性を評価するための体系的なベンチマークを提供する。
コードとデモ:https://github.com/ColaZhang22/Tool-Roco
関連論文リスト
- Multi-Agent Tool-Integrated Policy Optimization [67.12841355267678]
大規模言語モデル(LLM)は、知識集約的かつ複雑な推論タスクに対して、多ターンツール統合計画にますます依存している。
既存の実装は通常、単一のエージェントに依存するが、コンテキスト長とノイズの多いツールレスポンスに悩まされる。
ツール統合マルチエージェントフレームワークの効果的な強化学習をサポートする方法はない。
論文 参考訳(メタデータ) (2025-10-06T10:44:04Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。