論文の概要: WISE-Flow: Workflow-Induced Structured Experience for Self-Evolving Conversational Service Agents
- arxiv url: http://arxiv.org/abs/2601.08158v1
- Date: Tue, 13 Jan 2026 02:43:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.0281
- Title: WISE-Flow: Workflow-Induced Structured Experience for Self-Evolving Conversational Service Agents
- Title(参考訳): WISE-Flow: 自己進化型対話型サービスエージェントのためのワークフロー駆動型構造化エクスペリエンス
- Authors: Yuqing Zhou, Zhuoer Wang, Jie Yuan, Hong Wang, Samson Koelle, Ziwei Zhu, Wei Niu,
- Abstract要約: 大規模言語モデル(LLM)ベースのエージェントは、ユーザ向けサービスに広くデプロイされているが、新しいタスクではエラーが発生しやすい。
本稿では,過去のサービスインタラクションを再利用可能な手続き体験に変換する実現可能性中心のフレームワークであるWISE-Flowを提案する。
- 参考スコア(独自算出の注目度): 12.014029662322152
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM)-based agents are widely deployed in user-facing services but remain error-prone in new tasks, tend to repeat the same failure patterns, and show substantial run-to-run variability. Fixing failures via environment-specific training or manual patching is costly and hard to scale. To enable self-evolving agents in user-facing service environments, we propose WISE-Flow, a workflow-centric framework that converts historical service interactions into reusable procedural experience by inducing workflows with prerequisite-augmented action blocks. At deployment, WISE-Flow aligns the agent's execution trajectory to retrieved workflows and performs prerequisite-aware feasibility reasoning to achieve state-grounded next actions. Experiments on ToolSandbox and $τ^2$-bench show consistent improvement across base models.
- Abstract(参考訳): 大規模言語モデル(LLM)ベースのエージェントは、ユーザ対応のサービスに広くデプロイされているが、新しいタスクではエラーが発生しやすい。
環境固有のトレーニングや手動のパッチによる障害の修正は、費用がかかり、スケールが難しい。
ユーザ向けサービス環境における自己進化エージェントを実現するために,従来のサービスインタラクションを再利用可能な手続き的エクスペリエンスに変換するワークフロー中心のフレームワークWISE-Flowを提案する。
WISE-Flowはデプロイ時に、エージェントの実行軌跡を検索されたワークフローに整列させ、状態に整った次のアクションを達成するために、前提条件を意識した実行可能性推論を実行する。
ToolSandboxと$τ^2$-benchの実験は、ベースモデル間で一貫した改善を示している。
関連論文リスト
- DyFlow: Dynamic Workflow Framework for Agentic Reasoning [79.19799197382478]
DyFlowは動的ワークフロー生成フレームワークで、タスク要求とリアルタイム中間フィードバックに基づいて推論手順を適応的に構築し、調整する。
社会的推論,生物医学的タスク,数学的問題解決,コード生成など,さまざまな領域でDyFlowを体系的に評価する。
結果は、DyFlowが既存のベースラインを大幅に上回り、Pass@kの改善を実現し、さまざまなドメインにわたって堅牢な一般化を示すことを示した。
論文 参考訳(メタデータ) (2025-09-30T10:36:23Z) - Agent WARPP: Workflow Adherence via Runtime Parallel Personalization [0.0]
大規模言語モデル(LLM)はタスク指向対話(TOD)システムにますます適用されてきている。
並列パーソナライゼーション(WARPP)は、マルチエージェントランタイムとオーケストレーションを組み合わせた、トレーニング不要でモジュール化されたフレームワークである。
ユーザ属性に基づいて条件分岐を動的にプルーニングすることで、このフレームワークは推論のオーバーヘッドを減らし、実行時のツール選択を狭める。
論文 参考訳(メタデータ) (2025-07-23T23:27:49Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Action Engine: Automatic Workflow Generation in FaaS [1.4185188982404757]
Action Engineは、カーネルでtoolaugmented large language model(LLM)を使用して、人間の言語クエリを解釈する。
Action Engineは、データ間の依存関係をシームレスに管理し、開発者のクエリが処理され、解決されることを保証する。
論文 参考訳(メタデータ) (2024-11-29T05:54:41Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。