論文の概要: MermaidFlow: Redefining Agentic Workflow Generation via Safety-Constrained Evolutionary Programming
- arxiv url: http://arxiv.org/abs/2505.22967v1
- Date: Thu, 29 May 2025 01:08:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.601461
- Title: MermaidFlow: Redefining Agentic Workflow Generation via Safety-Constrained Evolutionary Programming
- Title(参考訳): MermaidFlow: 安全性に制約のある進化的プログラミングによるエージェントワークフロー生成の再定義
- Authors: Chengqi Zheng, Jianda Chen, Yueming Lyu, Wen Zheng Terence Ng, Haopeng Zhang, Yew-Soon Ong, Ivor Tsang, Haiyan Yin,
- Abstract要約: 本稿では,安全制約付きグラフの進化を通じてエージェント検索空間を再定義するフレームワークであるMermaidFlowを紹介する。
ドメインを意識した進化的演算子を定式化し、構造的多様性を促進しながら意味的正当性を維持する。
MermaidFlowは、成功率の一貫性の向上と、エージェント推論ベンチマークの実行可能な計画へのより高速な収束を実現している。
- 参考スコア(独自算出の注目度): 31.549367981711686
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the promise of autonomous agentic reasoning, existing workflow generation methods frequently produce fragile, unexecutable plans due to unconstrained LLM-driven construction. We introduce MermaidFlow, a framework that redefines the agentic search space through safety-constrained graph evolution. At its core, MermaidFlow represent workflows as a verifiable intermediate representation using Mermaid, a structured and human-interpretable graph language. We formulate domain-aware evolutionary operators, i.e., crossover, mutation, insertion, and deletion, to preserve semantic correctness while promoting structural diversity, enabling efficient exploration of a high-quality, statically verifiable workflow space. Without modifying task settings or evaluation protocols, MermaidFlow achieves consistent improvements in success rates and faster convergence to executable plans on the agent reasoning benchmark. The experimental results demonstrate that safety-constrained graph evolution offers a scalable, modular foundation for robust and interpretable agentic reasoning systems.
- Abstract(参考訳): 自律的なエージェント推論の約束にもかかわらず、既存のワークフロー生成手法は、制約のないLCM駆動の構築のために、脆弱で実行不可能な計画を生成することが多い。
本稿では,安全制約付きグラフの進化を通じてエージェント検索空間を再定義するフレームワークであるMermaidFlowを紹介する。
MermaidFlowの中核は、構造化され人間の解釈可能なグラフ言語であるMermaidを使って、ワークフローを検証可能な中間表現として表現している。
クロスオーバー、突然変異、挿入、削除といったドメイン認識の進化的演算子を定式化し、構造的多様性を促進しながら意味的正当性を保ち、高品質で静的に検証可能なワークフロー空間の効率的な探索を可能にする。
タスク設定や評価プロトコルを変更することなく、MermaidFlowは成功率を一貫して改善し、エージェント推論ベンチマークの実行可能な計画に迅速に収束する。
実験により、安全制約グラフの進化は、堅牢で解釈可能なエージェント推論システムのためのスケーラブルでモジュラーな基盤を提供することを示した。
関連論文リスト
- Agentic Predictor: Performance Prediction for Agentic Workflows via Multi-View Encoding [56.565200973244146]
Agentic Predictorは、効率的なエージェントワークフロー評価のための軽量な予測器である。
Agentic Predictorはタスク成功率の近似を学ぶことで、最適なエージェントワークフロー構成の迅速かつ正確な選択を可能にする。
論文 参考訳(メタデータ) (2025-05-26T09:46:50Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。