論文の概要: AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration
- arxiv url: http://arxiv.org/abs/2602.03786v1
- Date: Tue, 03 Feb 2026 17:46:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.615182
- Title: AOrchestra: Automating Sub-Agent Creation for Agentic Orchestration
- Title(参考訳): AOrchestra: エージェントオーケストレーションのためのサブエージェント作成の自動化
- Authors: Jianhao Ruan, Zhihao Xu, Yiran Peng, Fashen Ren, Zhaoyang Yu, Xinbing Liang, Jinyu Xiang, Bang Liu, Chenglin Wu, Yuyu Luo, Jiayi Zhang,
- Abstract要約: AOrchestraはフレームワークに依存しないエージェント抽象化で、任意のエージェントをインストラクション、コンテキストツール、モデルとしてモデル化する。
タスク関連コンテキスト、ツール、モデルをキュレートし、オンザフライで自動エージェント生成を通じて実行を委譲する。
AOrchestraはGeminiと組んで最強のベースラインに対して16.28%の相対的な改善を達成した。
- 参考スコア(独自算出の注目度): 34.22095903969545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Language agents have shown strong promise for task automation. Realizing this promise for increasingly complex, long-horizon tasks has driven the rise of a sub-agent-as-tools paradigm for multi-turn task solving. However, existing designs still lack a dynamic abstraction view of sub-agents, thereby hurting adaptability. We address this challenge with a unified, framework-agnostic agent abstraction that models any agent as a tuple Instruction, Context, Tools, Model. This tuple acts as a compositional recipe for capabilities, enabling the system to spawn specialized executors for each task on demand. Building on this abstraction, we introduce an agentic system AOrchestra, where the central orchestrator concretizes the tuple at each step: it curates task-relevant context, selects tools and models, and delegates execution via on-the-fly automatic agent creation. Such designs enable reducing human engineering efforts, and remain framework-agnostic with plug-and-play support for diverse agents as task executors. It also enables a controllable performance-cost trade-off, allowing the system to approach Pareto-efficient. Across three challenging benchmarks (GAIA, SWE-Bench, Terminal-Bench), AOrchestra achieves 16.28% relative improvement against the strongest baseline when paired with Gemini-3-Flash. The code is available at: https://github.com/FoundationAgents/AOrchestra
- Abstract(参考訳): 言語エージェントはタスク自動化を強く約束している。
ますます複雑で長い水平タスクに対するこの約束を実現することで、マルチターンタスク解決のためのサブエージェント・アズ・ツールのパラダイムが台頭した。
しかし、既存の設計にはサブエージェントの動的な抽象化ビューが欠けているため、適応性が損なわれている。
この課題に対処するフレームワークに依存しないエージェント抽象化は、任意のエージェントをタプル命令、コンテキスト、ツール、モデルとしてモデル化する。
このタプルは機能のための構成レシピとして機能し、システムは要求に応じてタスクごとに特別な実行子を生成できる。
この抽象化に基づいて、中央オーケストレータが各ステップでタプルを集約するエージェントシステムAOrchestraを導入し、タスク関連コンテキストをキュレートし、ツールやモデルを選択し、オンザフライの自動エージェント生成を通じて実行を委譲する。
このような設計により、ヒューマンエンジニアリングの労力を削減でき、様々なエージェントをタスク実行者としてプラグイン・アンド・プレイのサポートにフレームワークに依存しないままである。
また、制御可能なパフォーマンスコストのトレードオフを可能にし、システムはパレート効率にアプローチできる。
3つの挑戦的なベンチマーク(GAIA, SWE-Bench, Terminal-Bench)の中で、AOrchestraはGemini-3-Flashと組み合わせると、最強のベースラインに対して16.28%の相対的な改善を達成している。
コードは、https://github.com/FoundationAgents/AOrchestraで入手できる。
関連論文リスト
- GenAgent: Scaling Text-to-Image Generation via Agentic Multimodal Reasoning [54.42973725693]
我々は,エージェント型マルチモーダルモデルを用いて,視覚的理解と生成を統一したGenAgentを導入する。
GenAgentはGenEval++とWISEのベースジェネレータ(FLUX.1-dev)のパフォーマンスを大幅に向上させる。
本フレームワークは,1) 様々な機能を持つジェネレータへのクロスツール一般化,2) インタラクションラウンド間で一貫した改善を伴うテスト時間スケーリング,3) タスクに自動的に適応するタスク適応推論の3つの重要な特性を示す。
論文 参考訳(メタデータ) (2026-01-26T14:49:04Z) - BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization [41.08366028094234]
大規模言語モデル(LLM)は、現実世界のソフトウェア工学の問題を一般化するのに苦労する。
既存のシステムはワークフロー全体の問題を処理するために、単一のエージェントに依存することが多い。
人間の技術者が複雑な問題を分解する方法に触発され、我々はSWEエージェントをオーケストラとして構成し、特殊なサブエージェントをコーディネートすることを提案する。
論文 参考訳(メタデータ) (2025-12-29T17:41:11Z) - AgentMesh: A Cooperative Multi-Agent Generative AI Framework for Software Development Automation [0.0]
ソフトウェア開発タスクの自動化に複数のLCMエージェントを併用したPythonベースのフレームワークを提案する。
AgentMeshでは、Planner、Coder、Debugger、Reviewerといった特殊なエージェントが協力して、ハイレベルな要件を完全に実現されたコードに変換する。
論文 参考訳(メタデータ) (2025-07-26T10:10:02Z) - AgentOrchestra: Orchestrating Hierarchical Multi-Agent Intelligence with the Tool-Environment-Agent(TEA) Protocol [22.406849007798858]
本稿では,環境,エージェント,ツールを統一システムに統合するツール-環境-エージェントプロトコルを提案する。
本稿では,複雑な目的を分解し,特殊エージェントをコーディネートする中央計画エージェントを備えた階層型マルチエージェントフレームワークであるAgensOrchestraを紹介する。
論文 参考訳(メタデータ) (2025-06-14T13:45:37Z) - Multi-Agent Collaboration via Evolving Orchestration [55.574417128944226]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMに基づくマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し,タスク状態の進化に応じて,中央集権的なオーケストレータ("puppeteer")がエージェント("puppets")を動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - Magentic-One: A Generalist Multi-Agent System for Solving Complex Tasks [39.084974125007165]
本稿では,複雑なタスクを解くための高性能なオープンソースエージェントシステムMagentic-Oneを紹介する。
Magentic-Oneでは、リードエージェントであるOrchestratorが進捗を追跡し、エラーからリカバリするための再計画を行うマルチエージェントアーキテクチャを使用している。
Magentic-Oneは3つの多様かつ挑戦的なエージェントベンチマークにおいて、最先端技術に対して統計的に競争力を発揮することを示す。
論文 参考訳(メタデータ) (2024-11-07T06:36:19Z) - TaskBench: Benchmarking Large Language Models for Task Automation [82.2932794189585]
タスク自動化における大規模言語モデル(LLM)の機能を評価するためのフレームワークであるTaskBenchを紹介する。
具体的には、タスクの分解、ツールの選択、パラメータ予測を評価する。
提案手法は, 自動構築と厳密な人的検証を組み合わせることで, 人的評価との整合性を確保する。
論文 参考訳(メタデータ) (2023-11-30T18:02:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。