論文の概要: Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms
- arxiv url: http://arxiv.org/abs/2508.18298v1
- Date: Fri, 22 Aug 2025 17:41:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.503571
- Title: Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms
- Title(参考訳): Murakkab: クラウドプラットフォームにおけるリソース効率の良いエージェントワークフローオーケストレーション
- Authors: Gohar Irfan Chaudhry, Esha Choukse, Haoran Qiu, Íñigo Goiri, Rodrigo Fonseca, Adam Belay, Ricardo Bianchini,
- Abstract要約: MurakkabはエージェントAIアプリケーションのためのリソース効率の高いサービスシステムである。
エージェントの内部構造を公開することで、Murakkabは層間最適化を可能にする。
sysnameはGPU使用率を最大2.8$times$、エネルギー消費を3.7$times$、SLOを維持しながら4.3$times$に下げる。
- 参考スコア(独自算出の注目度): 7.6151320996822625
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Agentic workflows commonly coordinate multiple models and tools with complex control logic. They are quickly becoming the dominant paradigm for AI applications. However, serving them remains inefficient with today's frameworks. The key problem is that they expose workflows as opaque sequences of model and tool calls that tightly couple agent logic with model and hardware choices. Often, these workflow components are fragmented across different entities, preventing systems from reasoning about trade-offs across accuracy, latency, energy, and cost. This leads to resource waste and degraded service-level objectives (SLOs). We present Murakkab, a resource-efficient serving system for agentic workflows. Murakkab introduces a declarative abstraction that decouples workflow specification from execution configuration. A profile-guided optimizer and adaptive runtime jointly manage the full stack: orchestrating workflow components, mapping them to models and hardware, and dynamically reconfiguring execution to satisfy user-defined SLOs. By exposing the internal structure of agentic workflows, Murakkab enables cross-layer optimization that existing frameworks and cloud schedulers cannot achieve. Our evaluation on diverse workflows shows that \sysname{} reduces GPU usage by up to 2.8$\times$, energy consumption by 3.7$\times$, and cost by 4.3$\times$ while maintaining SLOs.
- Abstract(参考訳): エージェントワークフローは通常、複数のモデルとツールを複雑な制御ロジックで調整する。
それらは、AIアプリケーションにおいて、急速に支配的なパラダイムになりつつある。
しかし、それらを提供するのは今日のフレームワークでは非効率である。
重要な問題は、ワークフローをモデルとツールコールの不透明なシーケンスとして公開し、モデルとハードウェアの選択とエージェントロジックを密結合させることである。
これらのワークフローコンポーネントは、さまざまなエンティティにまたがって断片化され、正確性、レイテンシ、エネルギ、コストといったトレードオフをシステムが推論するのを防ぐことが多い。
これはリソースの浪費とサービスレベル目標(SLO)の低下につながります。
エージェントワークフローのための資源効率の高いサービスシステムであるMurakkabを提案する。
Murakkabは宣言的な抽象化を導入し、ワークフロー仕様と実行設定を分離する。
プロファイル誘導オプティマイザとアダプティブランタイムは、ワークフローコンポーネントのオーケストレーション、モデルとハードウェアへのマッピング、ユーザ定義のSLOを満たすための実行の動的再構成など、フルスタックを共同で管理する。
エージェントワークフローの内部構造を公開することで、Murakkabは既存のフレームワークやクラウドスケジューラが達成できないような、クロスレイヤな最適化を可能にする。
多様なワークフローに対する評価は,GPU使用率を最大2.8$\times$,エネルギー消費を3.7$\times$,SLOを維持しながら4.3$\times$に下げることを示す。
関連論文リスト
- Agent WARPP: Workflow Adherence via Runtime Parallel Personalization [0.0]
大規模言語モデル(LLM)はタスク指向対話(TOD)システムにますます適用されてきている。
並列パーソナライゼーション(WARPP)は、マルチエージェントランタイムとオーケストレーションを組み合わせた、トレーニング不要でモジュール化されたフレームワークである。
ユーザ属性に基づいて条件分岐を動的にプルーニングすることで、このフレームワークは推論のオーバーヘッドを減らし、実行時のツール選択を狭める。
論文 参考訳(メタデータ) (2025-07-23T23:27:49Z) - Cognify: Supercharging Gen-AI Workflows With Hierarchical Autotuning [6.328780056857816]
複数のMLモデルコール、ツール/APIコール、データ検索、ジェネリックコード実行を含むgen-AIは、しばしばアドホックな方法で手動でチューニングされる。
AdaSeekは、ユーザが指定した全検索予算に基づいて、ワークフローチューニング方法を異なるレイヤに整理する。
Cognifyはワークフローの生成品質を最大2.8倍に改善し、実行費用を最大10倍に削減し、エンドツーエンドのレイテンシを2.7倍に削減する。
論文 参考訳(メタデータ) (2025-02-12T01:36:27Z) - Towards Resource-Efficient Compound AI Systems [4.709762596591902]
複合AIシステムは、モデル、レトリバー、外部ツールなどの複数の相互作用コンポーネントを統合する。
現在の実装は、アプリケーションロジックと実行の詳細の密結合によって、非効率なリソース利用に悩まされています。
本稿では、動的スケジューリングとリソース認識意思決定のための宣言型ワークフロープログラミングモデルと適応型ランタイムシステムを提案する。
論文 参考訳(メタデータ) (2025-01-28T02:15:34Z) - Flow: Modularized Agentic Workflow Automation [53.073598156915615]
大規模言語モデル(LLM)を利用したマルチエージェントフレームワークは、自動計画とタスク実行において大きな成功を収めている。
しかし, 実行中のエージェントの効果的な調整は十分に研究されていない。
本稿では,エージェントによる継続的なワークフロー改善を可能にするアクティビティ・オン・頂点(AOV)グラフを定義する。
提案するマルチエージェントフレームワークは,サブタスクの効率的な同時実行,効果的なゴール達成,エラー耐性の向上を実現している。
論文 参考訳(メタデータ) (2025-01-14T04:35:37Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - SeBS-Flow: Benchmarking Serverless Cloud Function Workflows [51.4200085836966]
本稿では、最初のサーバーレスワークフローベンチマークスイートSeBS-Flowを提案する。
SeBS-Flowには6つの実世界のアプリケーションベンチマークと、異なる計算パターンを表す4つのマイクロベンチマークが含まれている。
当社では,パフォーマンス,コスト,スケーラビリティ,ランタイムの偏差など,3つの主要なクラウドプラットフォームに関する包括的な評価を実施しています。
論文 参考訳(メタデータ) (2024-10-04T14:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。