論文の概要: Automating Complex Document Workflows via Stepwise and Rollback-Enabled Operation Orchestration
- arxiv url: http://arxiv.org/abs/2512.04445v1
- Date: Thu, 04 Dec 2025 04:34:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.986953
- Title: Automating Complex Document Workflows via Stepwise and Rollback-Enabled Operation Orchestration
- Title(参考訳): ステップワイズとロールバック可能なオペレーションオーケストレーションによる複雑なドキュメントワークフローの自動化
- Authors: Yanbin Zhang, Hanhui Ye, Yue Bai, Qiming Zhang, Liao Xiang, Wu Mianzhi, Renjun Hu,
- Abstract要約: AutoDWは、段階的にロールバック可能なオペレーションオーケストレーションを可能にする実行フレームワークである。
ユーザ指示、インテントフィルタリングされたAPI候補、ドキュメントの進化状態を条件としたAPIアクションを計画している。
命令レベルとセッションレベルのタスクで、それぞれ90%と62%の完了率を達成する。
- 参考スコア(独自算出の注目度): 11.17707727509719
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Workflow automation promises substantial productivity gains in everyday document-related tasks. While prior agentic systems can execute isolated instructions, they struggle with automating multi-step, session-level workflows due to limited control over the operational process. To this end, we introduce AutoDW, a novel execution framework that enables stepwise, rollback-enabled operation orchestration. AutoDW incrementally plans API actions conditioned on user instructions, intent-filtered API candidates, and the evolving states of the document. It further employs robust rollback mechanisms at both the argument and API levels, enabling dynamic correction and fault tolerance. These designs together ensure that the execution trajectory of AutoDW remains aligned with user intent and document context across long-horizon workflows. To assess its effectiveness, we construct a comprehensive benchmark of 250 sessions and 1,708 human-annotated instructions, reflecting realistic document processing scenarios with interdependent instructions. AutoDW achieves 90% and 62% completion rates on instruction- and session-level tasks, respectively, outperforming strong baselines by 40% and 76%. Moreover, AutoDW also remains robust for the decision of backbone LLMs and on tasks with varying difficulty. Code and data will be open-sourced. Code: https://github.com/YJett/AutoDW
- Abstract(参考訳): ワークフロー自動化は、日々のドキュメント関連のタスクにおいて、大幅な生産性向上を約束します。
従来のエージェントシステムは独立した命令を実行できるが、運用プロセスの制御が限られているため、マルチステップのセッションレベルのワークフローを自動化するのに苦労する。
そこで我々は,段階的にロールバック可能なオペレーションオーケストレーションを可能にする,新しい実行フレームワークであるAutoDWを紹介した。
AutoDWは、ユーザーインストラクション、インテントフィルタリングされたAPI候補、ドキュメントの進化状態を条件としたAPIアクションを段階的に計画する。
さらに、引数レベルとAPIレベルの両方で堅牢なロールバックメカニズムを採用し、動的修正とフォールトトレランスを可能にしている。
これらの設計は、AutoDWの実行軌跡が、長期にわたるワークフロー全体にわたるユーザの意図とドキュメントコンテキストに一致し続けることを保証します。
提案手法の有効性を評価するため,250セッションと1,708命令の総合的なベンチマークを構築した。
AutoDWは、命令レベルとセッションレベルのタスクで90%と62%の完了率を獲得し、強いベースラインを40%と76%で上回っている。
さらにAutoDWは、バックボーンLSMの決定や、様々な困難を伴うタスクに対して堅牢なままである。
コードとデータはオープンソースになる。
コード:https://github.com/YJett/AutoDW
関連論文リスト
- Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - AutoFlow: Automated Workflow Generation for Large Language Model Agents [39.72700864347576]
大規模言語モデル(LLM)は、複雑な自然言語を理解する上で大きな進歩を見せている。
LLMエージェントが与えられたタスクを解決するための効果的で信頼性の高い手順に従うようにするために、手動で設計されるのが通常である。
複雑なタスクを解決するためにエージェントを自動的に生成するフレームワークであるAutoFlowを提案する。
論文 参考訳(メタデータ) (2024-07-01T21:05:02Z) - You Only Look at Screens: Multimodal Chain-of-Action Agents [37.118034745972956]
Auto-GUIは、インターフェースと直接対話するマルチモーダルソリューションである。
そこで本研究では,エージェントが実行すべきアクションを決定するためのチェーン・オブ・アクション手法を提案する。
我々は,30$Kのユニークな命令を持つ新しいデバイス制御ベンチマークAITWに対するアプローチを評価した。
論文 参考訳(メタデータ) (2023-09-20T16:12:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。