Fugu-MT 論文翻訳(概要): Learning to Compose for Cross-domain Agentic Workflow Generation

論文の概要: Learning to Compose for Cross-domain Agentic Workflow Generation

arxiv url: http://arxiv.org/abs/2602.11114v1
Date: Wed, 11 Feb 2026 18:27:22 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-12 21:44:02.310032
Title: Learning to Compose for Cross-domain Agentic Workflow Generation
Title（参考訳）: クロスドメインエージェントワークフロー生成のための構成学習
Authors: Jialiang Wang, Shengxiang Xu, Hanmo Liu, Jiachuan Wang, Yuyu Luo, Shimin Di, Min-Ling Zhang, Lei Chen,
Abstract要約: クロスドメインワークフロー生成のためのオープンソースのLLMを作成します。さまざまなドメインにわたる再利用可能なワークフロー機能のコンパクトなセットを学びます。当社の1パスジェネレータは、20イテレーションを消費するSOTAリファインメントベースラインを超えています。
参考スコア（独自算出の注目度）: 56.630382886594184
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automatically generating agentic workflows -- executable operator graphs or codes that orchestrate reasoning, verification, and repair -- has become a practical way to solve complex tasks beyond what single-pass LLM generation can reliably handle. Yet what constitutes a good workflow depends heavily on the task distribution and the available operators. Under domain shift, current systems typically rely on iterative workflow refinement to discover a feasible workflow from a large workflow space, incurring high iteration costs and yielding unstable, domain-specific behavior. In response, we internalize a decompose-recompose-decide mechanism into an open-source LLM for cross-domain workflow generation. To decompose, we learn a compact set of reusable workflow capabilities across diverse domains. To recompose, we map each input task to a sparse composition over these bases to generate a task-specific workflow in a single pass. To decide, we attribute the success or failure of workflow generation to counterfactual contributions from learned capabilities, thereby capturing which capabilities actually drive success by their marginal effects. Across stringent multi-domain, cross-domain, and unseen-domain evaluations, our 1-pass generator surpasses SOTA refinement baselines that consume 20 iterations, while substantially reducing generation latency and cost.
Abstract（参考訳）: 自動生成するエージェントワークフロー -- 推論、検証、修復をオーケストレーションする実行可能な演算子グラフやコード -- は、シングルパスのLLM生成が確実に処理できるもの以上の複雑なタスクを解決する実用的な方法になっています。しかし、良いワークフローを構成するものは、タスクの配布と利用可能なオペレータに大きく依存します。ドメインシフトの下では、現在のシステムは一般的に、大規模なワークフロー空間から実行可能なワークフローを発見し、高いイテレーションコストを発生させ、不安定でドメイン固有の振る舞いをもたらすために、反復的なワークフロー改善に依存します。そこで我々は,分解分解分解機構をオープンソース LLM に内部化し,クロスドメインワークフロー生成を行う。分解するために、さまざまなドメインにまたがる再利用可能なワークフロー機能のコンパクトなセットを学ぶ。再構成するために、各入力タスクをこれらのベース上のスパース構成にマッピングし、タスク固有のワークフローを1回のパスで生成する。そこで我々は,ワークフロー生成の成功と失敗を,学習能力からの反現実的な貢献とみなし,その限界効果によってどの能力が実際に成功を導くかを把握する。厳密なマルチドメイン、クロスドメイン、および目に見えないドメイン評価において、我々の1パスジェネレータは、20イテレーションを消費するSOTA改善ベースラインを超え、生成遅延とコストを大幅に削減する。

関連論文リスト

FlowMind: Execute-Summarize for Structured Workflow Generation from LLM Reasoning [5.153212048436295]
LLMは推論やツールの使用によって複雑なタスクを解くことができるが、これらのソリューションを構造化されたものに正確に翻訳することは依然として難しい。ツール使用のシーケンスとしてモデル化し、タスクを解決し、それらを確実に構築できるメカニズムを設計するものとして問題を再構築する。本稿では,ワークフロー構築からタスク実行を分離するExecute-Summarize(ES)フレームワークを提案する。
論文参考訳（メタデータ） (2026-02-12T10:04:42Z)
Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline [38.16649115214312]
一つのエージェントがKVキャッシュの再利用による効率上の利点を生かして均一性を実現できることを示す。本稿では,単一エージェントの実行を自動的に調整し,推論コストを削減するアルゴリズムを提案する。
論文参考訳（メタデータ） (2026-01-18T08:16:09Z)
Do We Always Need Query-Level Workflows? Rethinking Agentic Workflow Generation for Multi-Agent Systems [72.3575737073235]
マルチエージェントシステム(MAS)は、複数のエージェントを協調することで複雑なタスクを解決する。既存のアプローチはタスクレベルかクエリレベルで生成されるが、その相対的なコストと利点は未だ不明である。クエリレベルのワークフロー生成は必ずしも必要ではない、なぜなら、トップKレベルのタスクレベルの小さなセットが、すでに同等あるいはそれ以上のクエリをカバーしているからだ。
論文参考訳（メタデータ） (2026-01-16T10:05:51Z)
CodeR3: A GenAI-Powered Workflow Repair and Revival Ecosystem [0.5249805590164902]
CodeR$3$(コード修復、リバイバル、再利用のためのスタンド)と呼ばれる新しいレガシなワークフローマイグレーションシステムを提示します。我々は生成AIを用いて崩壊した特徴を分析し、それらをSnakemakeやVisFlowといった現代的なワークフロー技術に再現する。また、ステップワイズワークフロー分析、自動サービス置換、可視化、ヒューマン・イン・ザ・ループ・バリデーションも統合する。
論文参考訳（メタデータ） (2025-11-24T01:06:45Z)
DyFlow: Dynamic Workflow Framework for Agentic Reasoning [79.19799197382478]
DyFlowは動的ワークフロー生成フレームワークで、タスク要求とリアルタイム中間フィードバックに基づいて推論手順を適応的に構築し、調整する。社会的推論,生物医学的タスク,数学的問題解決,コード生成など,さまざまな領域でDyFlowを体系的に評価する。結果は、DyFlowが既存のベースラインを大幅に上回り、Pass@kの改善を実現し、さまざまなドメインにわたって堅牢な一般化を示すことを示した。
論文参考訳（メタデータ） (2025-09-30T10:36:23Z)
Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文参考訳（メタデータ） (2025-01-14T04:35:37Z)
WorkflowLLM: Enhancing Workflow Orchestration Capability of Large Language Models [105.46456444315693]
ワークフローオーケストレーションにおける大規模言語モデルの能力を高めるための,データ中心のフレームワークであるLLMを提案する。最初は106,763のサンプルで大規模な微調整Benchを構築し、28のカテゴリにわたる83のアプリケーションから1,503のAPIをカバーしている。 LlamaLlamaは複雑なAPIをオーケストレーションする能力を示しながら、優れた一般化性能を実現している。
論文参考訳（メタデータ） (2024-11-08T09:58:02Z)
Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文参考訳（メタデータ） (2024-10-10T12:41:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。