Fugu-MT 論文翻訳(概要): Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms

論文の概要: Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms

arxiv url: http://arxiv.org/abs/2508.18298v1
Date: Fri, 22 Aug 2025 17:41:27 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-27 17:42:38.503571
Title: Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms
Title（参考訳）: Murakkab: クラウドプラットフォームにおけるリソース効率の良いエージェントワークフローオーケストレーション
Authors: Gohar Irfan Chaudhry, Esha Choukse, Haoran Qiu, Íñigo Goiri, Rodrigo Fonseca, Adam Belay, Ricardo Bianchini,
Abstract要約: MurakkabはエージェントAIアプリケーションのためのリソース効率の高いサービスシステムである。エージェントの内部構造を公開することで、Murakkabは層間最適化を可能にする。 sysnameはGPU使用率を最大2.8$times$、エネルギー消費を3.7$times$、SLOを維持しながら4.3$times$に下げる。
参考スコア（独自算出の注目度）: 7.6151320996822625
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Agentic workflows commonly coordinate multiple models and tools with complex control logic. They are quickly becoming the dominant paradigm for AI applications. However, serving them remains inefficient with today's frameworks. The key problem is that they expose workflows as opaque sequences of model and tool calls that tightly couple agent logic with model and hardware choices. Often, these workflow components are fragmented across different entities, preventing systems from reasoning about trade-offs across accuracy, latency, energy, and cost. This leads to resource waste and degraded service-level objectives (SLOs). We present Murakkab, a resource-efficient serving system for agentic workflows. Murakkab introduces a declarative abstraction that decouples workflow specification from execution configuration. A profile-guided optimizer and adaptive runtime jointly manage the full stack: orchestrating workflow components, mapping them to models and hardware, and dynamically reconfiguring execution to satisfy user-defined SLOs. By exposing the internal structure of agentic workflows, Murakkab enables cross-layer optimization that existing frameworks and cloud schedulers cannot achieve. Our evaluation on diverse workflows shows that \sysname{} reduces GPU usage by up to 2.8$\times$, energy consumption by 3.7$\times$, and cost by 4.3$\times$ while maintaining SLOs.
Abstract（参考訳）: エージェントワークフローは通常、複数のモデルとツールを複雑な制御ロジックで調整する。それらは、AIアプリケーションにおいて、急速に支配的なパラダイムになりつつある。しかし、それらを提供するのは今日のフレームワークでは非効率である。重要な問題は、ワークフローをモデルとツールコールの不透明なシーケンスとして公開し、モデルとハードウェアの選択とエージェントロジックを密結合させることである。これらのワークフローコンポーネントは、さまざまなエンティティにまたがって断片化され、正確性、レイテンシ、エネルギ、コストといったトレードオフをシステムが推論するのを防ぐことが多い。これはリソースの浪費とサービスレベル目標(SLO)の低下につながります。エージェントワークフローのための資源効率の高いサービスシステムであるMurakkabを提案する。 Murakkabは宣言的な抽象化を導入し、ワークフロー仕様と実行設定を分離する。プロファイル誘導オプティマイザとアダプティブランタイムは、ワークフローコンポーネントのオーケストレーション、モデルとハードウェアへのマッピング、ユーザ定義のSLOを満たすための実行の動的再構成など、フルスタックを共同で管理する。エージェントワークフローの内部構造を公開することで、Murakkabは既存のフレームワークやクラウドスケジューラが達成できないような、クロスレイヤな最適化を可能にする。多様なワークフローに対する評価は,GPU使用率を最大2.8$\times$,エネルギー消費を3.7$\times$,SLOを維持しながら4.3$\times$に下げることを示す。

論文の概要: Murakkab: Resource-Efficient Agentic Workflow Orchestration in Cloud Platforms

関連論文リスト