論文の概要: Toward Self-Evolution-Ready Workflow Harnesses: A Reversible Migration Path and Convertibility Taxonomy for Expert LLM Pipelines
- arxiv url: http://arxiv.org/abs/2606.24598v1
- Date: Mon, 15 Jun 2026 15:27:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.994685
- Title: Toward Self-Evolution-Ready Workflow Harnesses: A Reversible Migration Path and Convertibility Taxonomy for Expert LLM Pipelines
- Title(参考訳): 自己進化型ワークフローのハーネスに向けて:専門家LLMパイプラインの可逆的マイグレーションパスと可逆性分類
- Authors: Yimo Lin, Zhen Zhang, Yibin Li,
- Abstract要約: "LLM + script" はドメイン知識をエンコードするが、フィードバックに基づいて実行を適応できない。
本稿では、レガシを構成可能、型付け可能、監査可能なステージに変換する可逆的なマイグレーションパスを提案する。
3層分類(A/B/C)はシステムハーネス内のルーティングステージとして実装され、ワークフローの準備ができていることを診断し、それに従ってルーティングする。
- 参考スコア(独自算出の注目度): 5.615474193486371
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: While expert-validated "LLM + script" workflows deliver significant value, they remain static: they encode hard-won domain knowledge yet fail to adapt execution based on feedback. Existing agent research predominantly targets greenfield agents and synthetic benchmarks, leaving the migration of active legacy workflows unresolved. To bridge this gap, we present a reversible, Strangler-Fig migration path that refactors legacy workflows into composable, typed, and auditable stages. Central to this framework is a three-tier convertibility taxonomy (A/B/C), implemented as a routing stage within the system harness, which diagnoses a workflow's readiness and routes it accordingly.
- Abstract(参考訳): 専門家が検証した"LLM + script"ワークフローは大きな価値を提供するが、静的なままである。
既存のエージェント研究は主にグリーンフィールドエージェントと合成ベンチマークをターゲットにしており、アクティブなレガシーワークフローの移行は未解決のままである。
このギャップを埋めるために、レガシーワークフローを構成可能、型付け可能、監査可能なステージにリファクタリングする、可逆的でStrangler-Figマイグレーションパスを提示します。
このフレームワークの中心は、3層変換可能性分類(A/B/C)であり、システムハーネス内のルーティングステージとして実装され、ワークフローの準備ができていることを診断し、それに従ってルーティングする。
関連論文リスト
- Adaptive Multimodal Agents-Based Framework for Automatic Workflow Execution [1.2132786136735432]
本稿では,異なる2相パイプラインによる自動ワークフロー実行を実現するための,新しいマルチエージェントフレームワークを提案する。
推論の間、エージェントはこの固定された事前確立されたグラフに対して適応検索拡張生成(RAG)を利用する。
実世界の文脈でフレームワークを検証し、限られたトレーニングデータであっても高い信頼性とセマンティックな認識を維持する能力を示す。
論文 参考訳(メタデータ) (2026-05-27T15:23:22Z) - Why Search When You Can Transfer? Amortized Agentic Workflow Design from Structural Priors [51.95306551061392]
エージェントワークフローの自動設計は、現在、タスクごとの反復検索に依存している。
本稿では,ワークフロー設計を再利用可能な構造的先入観に補正するフレームワークであるSWIFTを提案する。
SWIFTは5つのベンチマークで最先端の検索手法より優れている。
論文 参考訳(メタデータ) (2026-04-27T21:25:00Z) - WorkflowPerturb: Calibrated Stress Tests for Evaluating Multi-Agent Workflow Metrics [3.353474956121776]
ワークフロー評価メトリクスを研究するための制御されたベンチマークを紹介する。
黄金に摂動を施すことで作用する。
我々は,複数の計量系をベンチマークし,その感度とキャリブレーションを,期待されるスコア軌跡と残差を用いて分析する。
本研究は,メトリクスファミリー間の系統的差異を特徴付けるとともに,ワークフロー評価スコアの重大性を考慮した解釈を支援する。
論文 参考訳(メタデータ) (2026-02-20T04:54:31Z) - Learning to Compose for Cross-domain Agentic Workflow Generation [56.630382886594184]
クロスドメインワークフロー生成のためのオープンソースのLLMを作成します。
さまざまなドメインにわたる再利用可能なワークフロー機能のコンパクトなセットを学びます。
当社の1パスジェネレータは、20イテレーションを消費するSOTAリファインメントベースラインを超えています。
論文 参考訳(メタデータ) (2026-02-11T18:27:22Z) - WISE-Flow: Workflow-Induced Structured Experience for Self-Evolving Conversational Service Agents [12.014029662322152]
大規模言語モデル(LLM)ベースのエージェントは、ユーザ向けサービスに広くデプロイされているが、新しいタスクではエラーが発生しやすい。
本稿では,過去のサービスインタラクションを再利用可能な手続き体験に変換する実現可能性中心のフレームワークであるWISE-Flowを提案する。
論文 参考訳(メタデータ) (2026-01-13T02:43:41Z) - CodeR3: A GenAI-Powered Workflow Repair and Revival Ecosystem [0.5249805590164902]
CodeR$3$(コード修復、リバイバル、再利用のためのスタンド)と呼ばれる新しいレガシなワークフローマイグレーションシステムを提示します。
我々は生成AIを用いて崩壊した特徴を分析し、それらをSnakemakeやVisFlowといった現代的なワークフロー技術に再現する。
また、ステップワイズワークフロー分析、自動サービス置換、可視化、ヒューマン・イン・ザ・ループ・バリデーションも統合する。
論文 参考訳(メタデータ) (2025-11-24T01:06:45Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。