論文の概要: Multi-Agent Computer Use
- arxiv url: http://arxiv.org/abs/2606.01533v1
- Date: Mon, 01 Jun 2026 01:29:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.773433
- Title: Multi-Agent Computer Use
- Title(参考訳): マルチエージェントコンピュータの利用
- Authors: Jing Yu Koh, Ruslan Salakhutdinov, Daniel Fried,
- Abstract要約: 我々はマルチエージェント・コンピュータ・ユース(MACU)システムの評価・構築に向けて進むべきであると論じる。
本稿では、マネージャモデルがコンピュータ使用タスクを有向非巡回グラフ(DAG)として分解する汎用マルチエージェント構成を提案する。
各イテレーションで、マネージャは並列CUAサブエージェントをディスパッチし、DAGの準備ができているフロンティアでノードを実行する。
- 参考スコア(独自算出の注目度): 72.79887808312706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer use agents (CUAs) today are primarily deployed as single serial agents. This setup is suboptimal for complex long-horizon tasks that benefit from task decomposition, parallel execution, and consistent re-planning based on new information. In this paper, we argue that we should instead move towards evaluating and building multi-agent computer use (MACU) systems. These systems, which emphasize planning and parallel execution, alleviate many of the shortcomings of single-agent CUAs. We propose a general multi-agent setup in which a manager model decomposes computer use tasks as a directed acyclic graph (DAG), encoding relevant dependencies and goals for subagents. At each iteration, the manager dispatches parallel CUA subagents to carry out nodes on the ready frontier of the DAG, and continuously revises the DAG (adding, canceling, or rewriting nodes) as new findings arrive from subagents. This design treats the partially observable environment of computer use as a first class challenge: information that downstream agents may not be able to re-observe are retained and passed forward through the manager and DAG structure. We demonstrate that MACU consistently improves over strong single-agent baselines by $3.4-25.5\%$ on desktop (OSWorld) and web navigation (Online-Mind2Web, WebTailBench, Odysseys) benchmarks, exhibits more favorable test-time scaling, and solves complex long-horizon tasks where single-agent CUAs get stuck. On Odysseys, a long-horizon web navigation benchmark, MACU improves average task completion wall-clock time by ${\sim} 1.5 \times$, demonstrating its efficacy in speeding up traditionally slow CUA pipelines. Our findings highlight that multi-agent coordination is a promising axis for scaling computer use agents to work productively for longer and more effectively. We release all code and interactive visualizations at https://jykoh.com/multi-agent-computer-use.
- Abstract(参考訳): コンピュータ利用エージェント(CUA)は、主に単一のシリアルエージェントとしてデプロイされている。
このセットアップは、タスクの分解、並列実行、新しい情報に基づいた一貫した再計画の恩恵を受ける複雑な長期タスクに最適である。
本稿では,マルチエージェント・コンピュータ・ユース(MACU)システムの評価・構築に向けて進むべきであると論じる。
計画と並列実行を重視したこれらのシステムは、単一エージェントCUAの欠点の多くを軽減する。
本稿では,コンピュータ利用タスクを有向非巡回グラフ(DAG)として分解し,サブエージェントの依存関係と目標を符号化する汎用マルチエージェント構成を提案する。
各イテレーションで、マネージャは並列CUAサブエージェントを発行し、DAGの準備ができているフロンティアでノードを実行する。
この設計は、コンピュータ使用の部分的に観測可能な環境を第一級課題として扱い、下流のエージェントが再観測できない情報を保持し、マネージャとDAG構造を通して転送する。
私たちは、MACUがデスクトップ(OSWorld)とWebナビゲーション(Online-Mind2Web、WebTailBench、Odysseys)のベンチマークで、強力なシングルエージェントベースラインよりも一貫して3.4-25.5\%の値で改善していることを示し、より良好なテストタイムスケーリングを示し、シングルエージェントCUAsが立ち往生する複雑なロングホライゾンタスクを解決する。
長期にわたるWebナビゲーションベンチマークであるOdysseysでは、MACUが平均タスク完了ウォールクロック時間を${\sim} 1.5 \times$で改善し、従来の遅いCUAパイプラインを高速化する効果を示している。
この結果から, マルチエージェント協調は, コンピュータ使用エージェントを長期的, より効果的にスケールする上で有望な軸であることを示唆した。
コードとインタラクティブな視覚化はhttps://jykoh.com/multi-agent- computer-useで公開しています。
関連論文リスト
- Step-level Optimization for Efficient Computer-use Agents [51.29573359027217]
我々は、強力なコンピュータ利用エージェントは、実際は高価で遅いと論じている。
本稿では,コンピュータ利用エージェントのためのイベント駆動ステップレベルカスケードを提案する。
論文 参考訳(メタデータ) (2026-04-29T19:59:36Z) - GenericAgent: A Token-Efficient Self-Evolving LLM Agent via Contextual Information Density Maximization (V1.0) [56.81743709880371]
Long-Horizon Large Language Model (LLM) エージェントは、コンテキストによって根本的に制限される。
長い水平性能は、文脈長ではなく、有限の文脈予算内で意思決定関連情報がどれだけ維持されているかによって決定される。
我々は、情報密度とコンテキストの1つの原理に基づいて構築された汎用的自己進化型LLMエージェントシステムであるGenericAgent(GA)を提案する。
論文 参考訳(メタデータ) (2026-04-18T17:59:15Z) - Learning to Share: Selective Memory for Efficient Parallel Agentic Systems [49.78267008828593]
エージェントシステムは、反復的に推論する複数のエージェントを調整することで複雑なタスクを解決し、ツールを呼び出し、中間結果を交換する。
最近のアプローチでは、さまざまな推論の軌跡を探索するために、複数のエージェントチームが並行して運用されている。
我々は並列エージェントフレームワークのための学習された共有メモリ機構であるLearning to Share (LTS)を提案する。
論文 参考訳(メタデータ) (2026-02-05T18:20:21Z) - AgentGit: A Version Control Framework for Reliable and Scalable LLM-Powered Multi-Agent Systems [7.408263799616532]
AgentGitはGitライクなロールバックとブランチをマルチエージェントシステム(MAS)にもたらすフレームワークです。
AgentGitは冗長、ランタイム、トークンの使用を著しく削減し、複数のブランチをまたいだ並列探索をサポートしています。
この作業は、より堅牢なMAS設計への実践的なパスを提供し、コラボレーティブAIシステムにおけるエラー回復、安全な探索、計算、A/Bテストを可能にする。
論文 参考訳(メタデータ) (2025-11-01T17:11:31Z) - XAgents: A Unified Framework for Multi-Agent Cooperation via IF-THEN Rules and Multipolar Task Processing Graph [14.273739638741139]
XAgentsはマルチポーラタスク処理グラフとIF-THENルールに基づいて構築された統合マルチエージェント協調フレームワークである。
XAgentsは、知識型および論理型問合せタスクの両方において、最先端のシングルエージェントおよびマルチエージェントアプローチを一貫して超越している。
論文 参考訳(メタデータ) (2025-09-12T08:40:58Z) - PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - VillagerAgent: A Graph-Based Multi-Agent Framework for Coordinating Complex Task Dependencies in Minecraft [46.19145184507293]
我々は,複雑なエージェント間の依存関係を解決するために,非巡回グラフ多エージェントフレームワーク VillagerAgent を導入する。
VillagerBenchに関する実証的な評価は、VillierAgentが既存のAgentVerseモデルより優れていることを示す。
論文 参考訳(メタデータ) (2024-06-09T10:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。