論文の概要: EvoAgentX: An Automated Framework for Evolving Agentic Workflows
- arxiv url: http://arxiv.org/abs/2507.03616v1
- Date: Fri, 04 Jul 2025 14:43:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.802917
- Title: EvoAgentX: An Automated Framework for Evolving Agentic Workflows
- Title(参考訳): EvoAgentX - エージェントワークフローを進化させるためのフレームワーク
- Authors: Yingxu Wang, Siwei Liu, Jinyuan Fang, Zaiqiao Meng,
- Abstract要約: 本稿では,マルチエージェントシステムの生成,実行,進化的最適化を自動化するオープンソースプラットフォームであるEvoAgentXを紹介する。
我々は,HotPotQA,MBPP,MATH上のEvoAgentXをマルチホップ推論,コード生成,数学的問題解決のためにそれぞれ評価し,GAIAを用いて実世界のタスクで評価する。
- 参考スコア(独自算出の注目度): 22.183583263529236
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems (MAS) have emerged as a powerful paradigm for orchestrating large language models (LLMs) and specialized tools to collaboratively address complex tasks. However, existing MAS frameworks often require manual workflow configuration and lack native support for dynamic evolution and performance optimization. In addition, many MAS optimization algorithms are not integrated into a unified framework. In this paper, we present EvoAgentX, an open-source platform that automates the generation, execution, and evolutionary optimization of multi-agent workflows. EvoAgentX employs a modular architecture consisting of five core layers: the basic components, agent, workflow, evolving, and evaluation layers. Specifically, within the evolving layer, EvoAgentX integrates three MAS optimization algorithms, TextGrad, AFlow, and MIPRO, to iteratively refine agent prompts, tool configurations, and workflow topologies. We evaluate EvoAgentX on HotPotQA, MBPP, and MATH for multi-hop reasoning, code generation, and mathematical problem solving, respectively, and further assess it on real-world tasks using GAIA. Experimental results show that EvoAgentX consistently achieves significant performance improvements, including a 7.44% increase in HotPotQA F1, a 10.00% improvement in MBPP pass@1, a 10.00% gain in MATH solve accuracy, and an overall accuracy improvement of up to 20.00% on GAIA. The source code is available at: https://github.com/EvoAgentX/EvoAgentX
- Abstract(参考訳): マルチエージェントシステム(MAS)は、大規模言語モデル(LLM)と複雑なタスクを協調的に扱う特殊なツールを編成するための強力なパラダイムとして登場した。
しかし、既存のMASフレームワークは、しばしば手動のワークフロー設定を必要とし、動的進化とパフォーマンス最適化のネイティブサポートを欠いている。
さらに、多くのMAS最適化アルゴリズムは統合されたフレームワークに統合されていない。
本稿では,マルチエージェントワークフローの生成,実行,進化的最適化を自動化するオープンソースプラットフォームであるEvoAgentXを提案する。
EvoAgentXは、基本的なコンポーネント、エージェント、ワークフロー、進化、評価レイヤの5つのコアレイヤからなるモジュラーアーキテクチャを採用している。
具体的には、進化するレイヤの中で、EvoAgentXは3つのMAS最適化アルゴリズム、TextGrad、AFlow、MIPROを統合し、エージェントプロンプト、ツール設定、ワークフロートポロジを反復的に洗練する。
我々は,HotPotQA,MBPP,MATH上のEvoAgentXをマルチホップ推論,コード生成,数学的問題解決のためにそれぞれ評価し,GAIAを用いて実世界のタスクで評価する。
実験の結果,EvoAgentXは,HotPotQA F1の7.44%増加,MBPPpass@1の10.00%改善,MATHの10.00%向上,GAIAの20.00%の総合的精度向上など,一貫した性能向上を実現していることがわかった。
ソースコードは、https://github.com/EvoAgentX/EvoAgentXで入手できる。
関連論文リスト
- AgentGroupChat-V2: Divide-and-Conquer Is What LLM-Based Multi-Agent System Need [35.88121318813734]
大規模言語モデルに基づくマルチエージェントシステムは、社会シミュレーションや複雑なタスク解決領域において大きな可能性を示している。
AgentGroupChat-V2は、3つのコアイノベーションを通じてこれらの課題に対処する新しいフレームワークです。
AgentGroupChat-V2のさまざまなドメインでの優れたパフォーマンスを示す実験。
論文 参考訳(メタデータ) (2025-06-18T13:24:04Z) - Two Heads are Better Than One: Test-time Scaling of Multi-agent Collaborative Reasoning [29.580108004844856]
大規模言語モデル(LLM)上に構築されたマルチエージェントシステム(MAS)は、複雑で現実的なタスクを解決するための有望な道を提供する。
テストタイムスケーリング(TTS)の最近の進歩は、難解な推論タスクにおいて、シングルエージェントのパフォーマンスを大幅に改善した。
モデルレベルのトレーニングとシステムレベルの調整の両方を通じて協調推論を強化するために設計された適応型マルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-14T00:27:45Z) - EvoFlow: Evolving Diverse Agentic Workflows On The Fly [21.82515160298748]
EvoFlowは、複雑で異質なエージェントの集団を自動的に検索する、ニッチな進化アルゴリズムベースのフレームワークである。
EvoFlowは、単純なI/Oタスクから複雑なマルチターンインタラクションまで、多くの個体群を進化させることができる。
論文 参考訳(メタデータ) (2025-02-11T08:48:46Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z) - EvoAgent: Towards Automatic Multi-Agent Generation via Evolutionary Algorithms [55.77492625524141]
EvoAgentは、特殊エージェントをマルチエージェントシステムに自動的に拡張するジェネリックメソッドである。
EvoAgent は LLM エージェントのタスク解決能力を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2024-06-20T11:49:23Z) - SOEN-101: Code Generation by Emulating Software Process Models Using Large Language Model Agents [50.82665351100067]
FlowGenは、複数のLarge Language Model (LLM)エージェントに基づいたソフトウェアプロセスモデルをエミュレートするコード生成フレームワークである。
FlowGenScrumをHumanEval、HumanEval-ET、MBPP、MBPP-ETの4つのベンチマークで評価した。
論文 参考訳(メタデータ) (2024-03-23T14:04:48Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。