論文の概要: MermaidFlow: Redefining Agentic Workflow Generation via Safety-Constrained Evolutionary Programming
- arxiv url: http://arxiv.org/abs/2505.22967v1
- Date: Thu, 29 May 2025 01:08:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.601461
- Title: MermaidFlow: Redefining Agentic Workflow Generation via Safety-Constrained Evolutionary Programming
- Title(参考訳): MermaidFlow: 安全性に制約のある進化的プログラミングによるエージェントワークフロー生成の再定義
- Authors: Chengqi Zheng, Jianda Chen, Yueming Lyu, Wen Zheng Terence Ng, Haopeng Zhang, Yew-Soon Ong, Ivor Tsang, Haiyan Yin,
- Abstract要約: 本稿では,安全制約付きグラフの進化を通じてエージェント検索空間を再定義するフレームワークであるMermaidFlowを紹介する。
ドメインを意識した進化的演算子を定式化し、構造的多様性を促進しながら意味的正当性を維持する。
MermaidFlowは、成功率の一貫性の向上と、エージェント推論ベンチマークの実行可能な計画へのより高速な収束を実現している。
- 参考スコア(独自算出の注目度): 31.549367981711686
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the promise of autonomous agentic reasoning, existing workflow generation methods frequently produce fragile, unexecutable plans due to unconstrained LLM-driven construction. We introduce MermaidFlow, a framework that redefines the agentic search space through safety-constrained graph evolution. At its core, MermaidFlow represent workflows as a verifiable intermediate representation using Mermaid, a structured and human-interpretable graph language. We formulate domain-aware evolutionary operators, i.e., crossover, mutation, insertion, and deletion, to preserve semantic correctness while promoting structural diversity, enabling efficient exploration of a high-quality, statically verifiable workflow space. Without modifying task settings or evaluation protocols, MermaidFlow achieves consistent improvements in success rates and faster convergence to executable plans on the agent reasoning benchmark. The experimental results demonstrate that safety-constrained graph evolution offers a scalable, modular foundation for robust and interpretable agentic reasoning systems.
- Abstract(参考訳): 自律的なエージェント推論の約束にもかかわらず、既存のワークフロー生成手法は、制約のないLCM駆動の構築のために、脆弱で実行不可能な計画を生成することが多い。
本稿では,安全制約付きグラフの進化を通じてエージェント検索空間を再定義するフレームワークであるMermaidFlowを紹介する。
MermaidFlowの中核は、構造化され人間の解釈可能なグラフ言語であるMermaidを使って、ワークフローを検証可能な中間表現として表現している。
クロスオーバー、突然変異、挿入、削除といったドメイン認識の進化的演算子を定式化し、構造的多様性を促進しながら意味的正当性を保ち、高品質で静的に検証可能なワークフロー空間の効率的な探索を可能にする。
タスク設定や評価プロトコルを変更することなく、MermaidFlowは成功率を一貫して改善し、エージェント推論ベンチマークの実行可能な計画に迅速に収束する。
実験により、安全制約グラフの進化は、堅牢で解釈可能なエージェント推論システムのためのスケーラブルでモジュラーな基盤を提供することを示した。
関連論文リスト
- Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents [106.04963073116468]
フローチャートは意思決定プロセスを視覚化するための重要なツールです。
視覚言語モデルは、これらの図を分析する際に、存在しない接続や決定経路を幻覚させる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャートについて紹介する。
本稿では, グラフベースの推論により微細なホック帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
論文 参考訳(メタデータ) (2025-06-02T06:02:41Z) - Agentic Predictor: Performance Prediction for Agentic Workflows via Multi-View Encoding [56.565200973244146]
Agentic Predictorは、効率的なエージェントワークフロー評価のための軽量な予測器である。
Agentic Predictorはタスク成功率の近似を学ぶことで、最適なエージェントワークフロー構成の迅速かつ正確な選択を可能にする。
論文 参考訳(メタデータ) (2025-05-26T09:46:50Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - FlowBench: Revisiting and Benchmarking Workflow-Guided Planning for LLM-based Agents [64.1759086221016]
ワークフロー誘導計画の最初のベンチマークであるFlowBenchを紹介します。
FlowBenchは6つのドメインから51のシナリオをカバーしている。
以上の結果から,現在のLLMエージェントは良好な計画を立てるためにかなりの改善が必要であることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T06:13:00Z) - Grammar-based evolutionary approach for automated workflow composition
with domain-specific operators and ensemble diversity [0.36832029288386137]
本稿では,自動ワークフロー合成(AWC)のための文法に基づく進化的アプローチであるEvoFlowを紹介する。
EvoFlowはワークフロー構造を設計する際の柔軟性を強化し、実践者が自身の要求に最も適したアルゴリズムを選択することを可能にする。
以上の結果から,EvoFlowの遺伝的演算子と更新機構が,現在の先行手法よりも大幅に優れていることが示唆された。
論文 参考訳(メタデータ) (2024-02-03T11:29:14Z) - Distributional GFlowNets with Quantile Flows [73.73721901056662]
Generative Flow Networks(GFlowNets)は、エージェントが一連の意思決定ステップを通じて複雑な構造を生成するためのポリシーを学ぶ確率的サンプルの新たなファミリーである。
本研究では,GFlowNetの分散パラダイムを採用し,各フロー関数を分散化し,学習中により情報的な学習信号を提供する。
GFlowNet学習アルゴリズムは,リスク不確実性のあるシナリオを扱う上で不可欠な,リスクに敏感なポリシーを学習することができる。
論文 参考訳(メタデータ) (2023-02-11T22:06:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。