論文の概要: Learning to Compose for Cross-domain Agentic Workflow Generation
- arxiv url: http://arxiv.org/abs/2602.11114v1
- Date: Wed, 11 Feb 2026 18:27:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:02.310032
- Title: Learning to Compose for Cross-domain Agentic Workflow Generation
- Title(参考訳): クロスドメインエージェントワークフロー生成のための構成学習
- Authors: Jialiang Wang, Shengxiang Xu, Hanmo Liu, Jiachuan Wang, Yuyu Luo, Shimin Di, Min-Ling Zhang, Lei Chen,
- Abstract要約: クロスドメインワークフロー生成のためのオープンソースのLLMを作成します。
さまざまなドメインにわたる再利用可能なワークフロー機能のコンパクトなセットを学びます。
当社の1パスジェネレータは、20イテレーションを消費するSOTAリファインメントベースラインを超えています。
- 参考スコア(独自算出の注目度): 56.630382886594184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatically generating agentic workflows -- executable operator graphs or codes that orchestrate reasoning, verification, and repair -- has become a practical way to solve complex tasks beyond what single-pass LLM generation can reliably handle. Yet what constitutes a good workflow depends heavily on the task distribution and the available operators. Under domain shift, current systems typically rely on iterative workflow refinement to discover a feasible workflow from a large workflow space, incurring high iteration costs and yielding unstable, domain-specific behavior. In response, we internalize a decompose-recompose-decide mechanism into an open-source LLM for cross-domain workflow generation. To decompose, we learn a compact set of reusable workflow capabilities across diverse domains. To recompose, we map each input task to a sparse composition over these bases to generate a task-specific workflow in a single pass. To decide, we attribute the success or failure of workflow generation to counterfactual contributions from learned capabilities, thereby capturing which capabilities actually drive success by their marginal effects. Across stringent multi-domain, cross-domain, and unseen-domain evaluations, our 1-pass generator surpasses SOTA refinement baselines that consume 20 iterations, while substantially reducing generation latency and cost.
- Abstract(参考訳): 自動生成するエージェントワークフロー -- 推論、検証、修復をオーケストレーションする実行可能な演算子グラフやコード -- は、シングルパスのLLM生成が確実に処理できるもの以上の複雑なタスクを解決する実用的な方法になっています。
しかし、良いワークフローを構成するものは、タスクの配布と利用可能なオペレータに大きく依存します。
ドメインシフトの下では、現在のシステムは一般的に、大規模なワークフロー空間から実行可能なワークフローを発見し、高いイテレーションコストを発生させ、不安定でドメイン固有の振る舞いをもたらすために、反復的なワークフロー改善に依存します。
そこで我々は,分解分解分解機構をオープンソース LLM に内部化し,クロスドメインワークフロー生成を行う。
分解するために、さまざまなドメインにまたがる再利用可能なワークフロー機能のコンパクトなセットを学ぶ。
再構成するために、各入力タスクをこれらのベース上のスパース構成にマッピングし、タスク固有のワークフローを1回のパスで生成する。
そこで我々は,ワークフロー生成の成功と失敗を,学習能力からの反現実的な貢献とみなし,その限界効果によってどの能力が実際に成功を導くかを把握する。
厳密なマルチドメイン、クロスドメイン、および目に見えないドメイン評価において、我々の1パスジェネレータは、20イテレーションを消費するSOTA改善ベースラインを超え、生成遅延とコストを大幅に削減する。
関連論文リスト
- CodeR3: A GenAI-Powered Workflow Repair and Revival Ecosystem [0.5249805590164902]
CodeR$3$(コード修復、リバイバル、再利用のためのスタンド)と呼ばれる新しいレガシなワークフローマイグレーションシステムを提示します。
我々は生成AIを用いて崩壊した特徴を分析し、それらをSnakemakeやVisFlowといった現代的なワークフロー技術に再現する。
また、ステップワイズワークフロー分析、自動サービス置換、可視化、ヒューマン・イン・ザ・ループ・バリデーションも統合する。
論文 参考訳(メタデータ) (2025-11-24T01:06:45Z) - DyFlow: Dynamic Workflow Framework for Agentic Reasoning [79.19799197382478]
DyFlowは動的ワークフロー生成フレームワークで、タスク要求とリアルタイム中間フィードバックに基づいて推論手順を適応的に構築し、調整する。
社会的推論,生物医学的タスク,数学的問題解決,コード生成など,さまざまな領域でDyFlowを体系的に評価する。
結果は、DyFlowが既存のベースラインを大幅に上回り、Pass@kの改善を実現し、さまざまなドメインにわたって堅牢な一般化を示すことを示した。
論文 参考訳(メタデータ) (2025-09-30T10:36:23Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。