論文の概要: Why Search When You Can Transfer? Amortized Agentic Workflow Design from Structural Priors
- arxiv url: http://arxiv.org/abs/2604.25012v1
- Date: Mon, 27 Apr 2026 21:25:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.60797
- Title: Why Search When You Can Transfer? Amortized Agentic Workflow Design from Structural Priors
- Title(参考訳): トランスファーできるのはなぜか? 構造的事前のエージェントワークフロー設計を暗記する
- Authors: Shiyi Du, Jiayuan Liu, Weihua Du, Yue Huang, Jiayi Li, Yingtao Luo, Xiangliang Zhang, Vincent Conitzer, Carl Kingsford,
- Abstract要約: エージェントワークフローの自動設計は、現在、タスクごとの反復検索に依存している。
本稿では,ワークフロー設計を再利用可能な構造的先入観に補正するフレームワークであるSWIFTを提案する。
SWIFTは5つのベンチマークで最先端の検索手法より優れている。
- 参考スコア(独自算出の注目度): 51.95306551061392
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated agentic workflow design currently relies on per-task iterative search, which is computationally prohibitive and fails to reuse structural knowledge across tasks. We observe that optimized workflows converge to a small family of domain-specific topologies, suggesting that this combinatorial search is largely redundant. Building on this insight, we propose SWIFT (Synthesizing Workflows via Few-shot Transfer), a framework that amortizes workflow design into reusable structural priors. SWIFT first distills compositional heuristics and output-interface contracts from contrastive analysis of prior search trajectories across source tasks. At inference time, it conditions a single LLM generation pass on these priors together with cross-task workflow demonstrations to synthesize a complete, executable workflow for an unseen target task, bypassing iterative search entirely. On five benchmarks, SWIFT outperforms the state-of-the-art search-based method while reducing marginal per-task optimization cost by three orders of magnitude. It further generalizes to four additional unseen benchmarks and transfers successfully from GPT-4o-mini to three additional foundation models (Grok, Qwen, Gemma). Controlled ablations reveal that workflow demonstrations primarily transfer topological structure rather than surface semantics: replacing all operator names with random strings still retains over 93% of the full system's average performance.
- Abstract(参考訳): 自動エージェントワークフロー設計は、現在、タスクごとの反復探索に依存しており、計算的に禁止されており、タスク全体にわたる構造的知識の再利用に失敗している。
最適化されたワークフローは、ドメイン固有のトポロジの小さなファミリーに収束し、この組合せ探索は大部分が冗長であることを示す。
この知見に基づいて、ワークフロー設計を再利用可能な構造的前提に補正するフレームワークであるSWIFT(Synthesizing Workflows via Few-shot Transfer)を提案する。
SWIFTは、まず、ソースタスク間の事前探索軌跡の対照的な分析から構成的ヒューリスティックスと出力-インタフェース契約を蒸留する。
推論時に、1つのLCM生成がこれらの先行をパスし、クロスタスクワークフローのデモとともに、未確認のターゲットタスクのための完全な実行ワークフローを合成し、反復探索を完全にバイパスする。
5つのベンチマークで、SWIFTは最先端の検索ベース手法より優れており、タスクごとの最適化コストを3桁削減している。
さらに、GPT-4o-miniからGrok、Qwen、Gemmaの3つの基盤モデルへの変換に成功している。
すべてのオペレータ名をランダム文字列に置き換えることは、システム全体の平均パフォーマンスの93%以上を維持している。
関連論文リスト
- Learning to Compose for Cross-domain Agentic Workflow Generation [56.630382886594184]
クロスドメインワークフロー生成のためのオープンソースのLLMを作成します。
さまざまなドメインにわたる再利用可能なワークフロー機能のコンパクトなセットを学びます。
当社の1パスジェネレータは、20イテレーションを消費するSOTAリファインメントベースラインを超えています。
論文 参考訳(メタデータ) (2026-02-11T18:27:22Z) - WorkflowLLM: Enhancing Workflow Orchestration Capability of Large Language Models [105.46456444315693]
ワークフローオーケストレーションにおける大規模言語モデルの能力を高めるための,データ中心のフレームワークであるLLMを提案する。
最初は106,763のサンプルで大規模な微調整Benchを構築し、28のカテゴリにわたる83のアプリケーションから1,503のAPIをカバーしている。
LlamaLlamaは複雑なAPIをオーケストレーションする能力を示しながら、優れた一般化性能を実現している。
論文 参考訳(メタデータ) (2024-11-08T09:58:02Z) - AFlow: Automating Agentic Workflow Generation [36.61172223528231]
大規模言語モデル(LLM)は、様々な領域にわたる複雑なタスクを解く上で、顕著な可能性を示している。
我々は、Monte Carlo Tree Searchを使って、この空間を効率的に探索する自動化フレームワークであるAFlowを紹介します。
6つのベンチマークデータセットに対する実証的な評価は、AFlowの有効性を示し、最先端のベースラインよりも平均5.7%向上している。
論文 参考訳(メタデータ) (2024-10-14T17:40:40Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。