論文の概要: DCAF: A Dynamic Computation Allocation Framework for Online Serving
System
- arxiv url: http://arxiv.org/abs/2006.09684v1
- Date: Wed, 17 Jun 2020 07:00:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 21:20:01.517407
- Title: DCAF: A Dynamic Computation Allocation Framework for Online Serving
System
- Title(参考訳): dcaf: オンラインサービスシステムのための動的計算割り当てフレームワーク
- Authors: Biye Jiang, Pengye Zhang, Rihan Chen, Binding Dai, Xinchen Luo, Yin
Yang, Guan Wang, Guorui Zhou, Xiaoqiang Zhu, Kun Gai
- Abstract要約: オンラインサービスシステムは,各トラフィック要求を異なる方法で処理し,その価値に基づいて「個人化」リソースを割り当てる,という新しい考え方を導入する。
私たちは20%の計算リソース削減で、同じビジネスパフォーマンスを維持することができます。
- 参考スコア(独自算出の注目度): 20.705598408760952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern large-scale systems such as recommender system and online advertising
system are built upon computation-intensive infrastructure. The typical
objective in these applications is to maximize the total revenue, e.g.
GMV~(Gross Merchandise Volume), under a limited computation resource. Usually,
the online serving system follows a multi-stage cascade architecture, which
consists of several stages including retrieval, pre-ranking, ranking, etc.
These stages usually allocate resource manually with specific computing power
budgets, which requires the serving configuration to adapt accordingly. As a
result, the existing system easily falls into suboptimal solutions with respect
to maximizing the total revenue. The limitation is due to the face that,
although the value of traffic requests vary greatly, online serving system
still spends equal computing power among them.
In this paper, we introduce a novel idea that online serving system could
treat each traffic request differently and allocate "personalized" computation
resource based on its value. We formulate this resource allocation problem as a
knapsack problem and propose a Dynamic Computation Allocation Framework~(DCAF).
Under some general assumptions, DCAF can theoretically guarantee that the
system can maximize the total revenue within given computation budget. DCAF
brings significant improvement and has been deployed in the display advertising
system of Taobao for serving the main traffic. With DCAF, we are able to
maintain the same business performance with 20\% computation resource
reduction.
- Abstract(参考訳): 推薦システムやオンライン広告システムは計算集約的なインフラ上に構築されている。
これらの応用の典型的な目的は、GMV~(Gross Merchandise Volume)のような総収益を限られた計算資源の下で最大化することである。
通常、オンラインサービスシステムは、検索、序列、ランキングなどを含むいくつかの段階からなる多段階のカスケードアーキテクチャに従う。
これらのステージは通常、リソースを特定のコンピューティングパワー予算に手動で割り当てる。
その結果、既存システムは総収益の最大化に関して、容易に準最適解に陥る。
この制限は、トラフィック要求の価値は大きく異なるが、オンラインサービスシステムは依然として同等のコンピューティングパワーを消費しているためである。
本稿では,オンラインサービスシステムが各トラフィック要求を異なる方法で処理し,その値に基づいて「個人化された」計算資源を割り当てる,という新しい考え方を紹介する。
我々は,この資源割当問題をナップサック問題として定式化し,動的計算割当フレームワーク~(dcaf)を提案する。
いくつかの一般的な仮定の下では、DCAFはシステムが所定の計算予算内での総収入を最大化できることを理論的に保証することができる。
DCAFは、大きな改善をもたらし、主要なトラフィックを提供するため、Taobaoのディスプレイ広告システムに展開されている。
DCAFでは、20倍の計算リソース削減で、同じビジネスパフォーマンスを維持することができます。
関連論文リスト
- Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Federated Reinforcement Learning for Resource Allocation in V2X Networks [46.6256432514037]
資源配分はV2Xネットワークの性能に大きな影響を及ぼす。
リソース割り当てのための既存のアルゴリズムのほとんどは、最適化や機械学習に基づいている。
本稿では,連合型強化学習の枠組みの下で,V2Xネットワークにおける資源配分について検討する。
論文 参考訳(メタデータ) (2023-10-15T15:26:54Z) - Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - Network Aware Compute and Memory Allocation in Optically Composable Data
Centres with Deep Reinforcement Learning and Graph Neural Networks [0.0]
リソースを分離したデータセンタアーキテクチャは、データセンタ内でリソースをリモートにプールする手段を約束する。
データセンターネットワーク(DCN)における光スイッチング回路のバックボーンを用いて,これを実現する方法を示す。
本稿では, エンフディープ強化学習を用いて, 効率的なエンフネットワーク認識と, エンフトポロジ的にスケール可能なアロケーションポリシをエンドツーエンドに学習する方法を示す。
論文 参考訳(メタデータ) (2022-10-26T09:46:50Z) - Movement Penalized Bayesian Optimization with Application to Wind Energy
Systems [84.7485307269572]
文脈ベイズ最適化(CBO)は、与えられた側情報を逐次決定する強力なフレームワークである。
この設定では、学習者は各ラウンドでコンテキスト(天気条件など)を受け取り、アクション(タービンパラメータなど)を選択する必要がある。
標準的なアルゴリズムは、すべてのラウンドで意思決定を切り替えるコストを前提としませんが、多くの実用的なアプリケーションでは、このような変更に関連するコストが最小化されるべきです。
論文 参考訳(メタデータ) (2022-10-14T20:19:32Z) - Computation Resource Allocation Solution in Recommender Systems [19.456109814747048]
限られた計算資源と応答時間でビジネス目標を最大化する計算資源割当ソリューション(CRAS)を提案します。
本手法の有効性はtaobao.comの実データに基づく広範囲な実験により検証された。
論文 参考訳(メタデータ) (2021-03-03T08:41:43Z) - The Best of Many Worlds: Dual Mirror Descent for Online Allocation
Problems [7.433931244705934]
本稿では,意思決定者に対して未知の入力モデルを用いて,各要求に対する報酬とリソース消費を生成するデータ駆動型設定について考察する。
様々な入力モデルにおいて,どの入力に直面するかを知ることなく,優れた性能が得られるアルゴリズムの一般クラスを設計する。
我々のアルゴリズムはラグランジアン双対空間で動作し、オンラインミラー降下を用いて更新される各リソースに対して双対乗算器を保持する。
論文 参考訳(メタデータ) (2020-11-18T18:39:17Z) - Multi-Agent Deep Reinforcement Learning enabled Computation Resource
Allocation in a Vehicular Cloud Network [30.736512922808362]
本稿では,分散アドホック車載ネットワークにおける中央集権的なインフラサポートのない計算資源配分問題について検討する。
VCNにおける真の中央制御ユニットの欠如というジレンマを克服するため、車両上での割り当てを分散的に完了する。
論文 参考訳(メタデータ) (2020-08-14T17:02:24Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z) - AI-based Resource Allocation: Reinforcement Learning for Adaptive
Auto-scaling in Serverless Environments [0.0]
近年、サーバーレスコンピューティングはクラウドコンピューティングモデルの魅力的な新しいパラダイムとして現れています。
商用およびオープンソースのサーバレスコンピューティングプラットフォームに共通するアプローチは、ワークロードベースの自動スケーリングである。
本稿では、サーバーレスフレームワークにおける要求ベース自動スケーリングに対する強化学習アプローチの適用性について検討する。
論文 参考訳(メタデータ) (2020-05-29T06:18:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。