論文の概要: Opus: A Quantitative Framework for Workflow Evaluation
- arxiv url: http://arxiv.org/abs/2511.04220v1
- Date: Thu, 06 Nov 2025 09:35:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.378102
- Title: Opus: A Quantitative Framework for Workflow Evaluation
- Title(参考訳): Opus: ワークフロー評価のための定量的フレームワーク
- Authors: Alan Seroul, Théo Fagnoni, Inès Adnani, Dana O. Mohamed, Phillip Kingston,
- Abstract要約: 本稿では,品質と効率を定量化するための確率的ノルミティブな定式化であるOpus Evaluation Frameworkを紹介する。
このフレームワークは、成功可能性、リソース使用量、アウトプットゲインを通じて期待されるパフォーマンスを推定する関数であるOpus Rewardと、測定可能な関数のセットであるOpus Normative Penaltiesを組み合わせたものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper introduces the Opus Workflow Evaluation Framework, a probabilistic-normative formulation for quantifying Workflow quality and efficiency. It integrates notions of correctness, reliability, and cost into a coherent mathematical model that enables direct comparison, scoring, and optimization of Workflows. The framework combines the Opus Workflow Reward, a probabilistic function estimating expected performance through success likelihood, resource usage, and output gain, with the Opus Workflow Normative Penalties, a set of measurable functions capturing structural and informational quality across Cohesion, Coupling, Observability, and Information Hygiene. It supports automated Workflow assessment, ranking, and optimization within modern automation systems such as Opus and can be integrated into Reinforcement Learning loops to guide Workflow discovery and refinement. In this paper, we introduce the Opus Workflow Reward model that formalizes Workflow success as a probabilistic expectation over costs and outcomes. We define measurable Opus Workflow Normative Penalties capturing structural, semantic, and signal-related properties of Workflows. Finally, we propose a unified optimization formulation for identifying and ranking optimal Workflows under joint Reward-Penalty trade-offs.
- Abstract(参考訳): 本稿では、ワークフローの品質と効率を定量化するための確率的ノルミティブな定式化であるOpus Workflow Evaluation Frameworkを紹介する。
正確性、信頼性、コストの概念を一貫性のある数学的モデルに統合し、ワークフローの直接比較、スコアリング、最適化を可能にします。
このフレームワークは、成功可能性、リソース使用量、アウトプットゲインを通じて期待されるパフォーマンスを推定する確率関数であるOpus Workflow Rewardと、Cohesion、Coupling、Observability、Information Hygieneにまたがる構造的および情報品質を計測する測定可能な関数セットであるOpus Workflow Normative Penaltiesを組み合わせたものだ。
Opusのような現代的な自動化システムでは、ワークフローの自動評価、ランキング、最適化をサポートしており、ワークフローの発見と改善をガイドするために強化学習ループに統合することができる。
本稿では,ワークフローの成功をコストと成果に対する確率論的期待として形式化するOpus Workflow Rewardモデルを紹介する。
我々は、ワークフローの構造、意味、および信号に関連する特性をキャプチャする計測可能なOpus Workflow Normative Penaltiesを定義する。
最後に、協調したReward-Penaltyトレードオフの下で最適なワークフローを特定し、ランク付けするための統一的な最適化式を提案する。
関連論文リスト
- ScoreFlow: Mastering LLM Agent Workflows via Score-based Preference Optimization [51.280919773837645]
エージェントワークフロー最適化のための高性能フレームワークであるScoreFlowを開発した。
ScoreFlowは、量的フィードバックを考慮に入れた直接選好最適化手法の新たな変種であるScore-DPOを組み込んでいる。
質問応答、コーディング、数学的推論を通じて、既存のベースラインよりも8.2%改善されている。
論文 参考訳(メタデータ) (2025-02-06T18:47:49Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Opus: A Large Work Model for Complex Workflow Generation [0.0]
Opusは、複雑なビジネスプロセスアウトソーシング(BPO)ユースケースに適したタスクの生成と最適化のためのフレームワークである。
このアプローチでは、クライアント入力、クライアント出力、プロセス指向コンテキストのアライメントとして定義されたインテンションから実行ファイルを生成します。
論文 参考訳(メタデータ) (2024-11-30T20:00:41Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。