論文の概要: SEW: Self-Evolving Agentic Workflows for Automated Code Generation
- arxiv url: http://arxiv.org/abs/2505.18646v1
- Date: Sat, 24 May 2025 11:12:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.563935
- Title: SEW: Self-Evolving Agentic Workflows for Automated Code Generation
- Title(参考訳): SEW: 自動コード生成のためのセルフ進化型エージェントワークフロー
- Authors: Siwei Liu, Jinyuan Fang, Han Zhou, Yingxu Wang, Zaiqiao Meng,
- Abstract要約: textbfSelf-textbfEvolving textbfSEW(textbfSEW)を提案する。
当社のSEWは,エージェントを自動設計し,自己進化を通じて最適化することが可能で,LiveCodeBenchの33%の改善を実現しています。
- 参考スコア(独自算出の注目度): 24.16770109875788
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have demonstrated effectiveness in code generation tasks. To enable LLMs to address more complex coding challenges, existing research has focused on crafting multi-agent systems with agentic workflows, where complex coding tasks are decomposed into sub-tasks, assigned to specialized agents. Despite their effectiveness, current approaches heavily rely on hand-crafted agentic workflows, with both agent topologies and prompts manually designed, which limits their ability to automatically adapt to different types of coding problems. To address these limitations and enable automated workflow design, we propose \textbf{S}elf-\textbf{E}volving \textbf{W}orkflow (\textbf{SEW}), a novel self-evolving framework that automatically generates and optimises multi-agent workflows. Extensive experiments on three coding benchmark datasets, including the challenging LiveCodeBench, demonstrate that our SEW can automatically design agentic workflows and optimise them through self-evolution, bringing up to 33\% improvement on LiveCodeBench compared to using the backbone LLM only. Furthermore, by investigating different representation schemes of workflow, we provide insights into the optimal way to encode workflow information with text.
- Abstract(参考訳): LLM(Large Language Models)は、コード生成タスクにおいて有効性を示す。
LLMがより複雑なコーディング課題に対処できるようにするため、既存の研究はエージェントワークフローによるマルチエージェントシステムの構築に重点を置いており、複雑なコーディングタスクは、特殊なエージェントに割り当てられたサブタスクに分解される。
その効果にもかかわらず、現在のアプローチは手作りのエージェントワークフローに大きく依存しており、エージェントトポロジとプロンプトの両方が手作業で設計されている。
これらの制約に対処し、自動ワークフロー設計を可能にするために、マルチエージェントワークフローを自動生成し最適化する新しい自己進化フレームワークである \textbf{S}elf-\textbf{E}volving \textbf{W}orkflow (\textbf{SEW})を提案する。
挑戦的なLiveCodeBenchを含む3つのコーディングベンチマークデータセットに関する大規模な実験では、SEWがエージェントワークフローを自動設計し、自己進化を通じて最適化できることが示されています。
さらに、ワークフローの様々な表現スキームを調査することにより、ワークフロー情報をテキストでエンコードする最適な方法に関する洞察を提供する。
関連論文リスト
- Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - ComfyGen: Prompt-Adaptive Workflows for Text-to-Image Generation [87.39861573270173]
本稿では,各ユーザプロンプトに自動的にワークフローをカスタマイズすることを目的とする,プロンプト適応型ワークフロー生成の新しいタスクを紹介する。
本稿では,この課題に対処する2つの LLM ベースの手法を提案する。ユーザ・参照データから学習するチューニングベース手法と,既存のフローを選択するために LLM を使用するトレーニングフリー手法である。
本研究は,現場における既存研究の方向性を補完し,テキスト・画像生成の品質向上のための新たな経路を提供することを示す。
論文 参考訳(メタデータ) (2024-10-02T16:43:24Z) - AutoFlow: Automated Workflow Generation for Large Language Model Agents [39.72700864347576]
大規模言語モデル(LLM)は、複雑な自然言語を理解する上で大きな進歩を見せている。
LLMエージェントが与えられたタスクを解決するための効果的で信頼性の高い手順に従うようにするために、手動で設計されるのが通常である。
複雑なタスクを解決するためにエージェントを自動的に生成するフレームワークであるAutoFlowを提案する。
論文 参考訳(メタデータ) (2024-07-01T21:05:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。