論文の概要: Computation Resource Allocation Solution in Recommender Systems
- arxiv url: http://arxiv.org/abs/2103.02259v1
- Date: Wed, 3 Mar 2021 08:41:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-04 14:45:03.328386
- Title: Computation Resource Allocation Solution in Recommender Systems
- Title(参考訳): リコメンダシステムにおける計算資源配分ソリューション
- Authors: Xun Yang, Yunli Wang, Cheng Chen, Qing Tan, Chuan Yu, Jian Xu,
Xiaoqiang Zhu
- Abstract要約: 限られた計算資源と応答時間でビジネス目標を最大化する計算資源割当ソリューション(CRAS)を提案します。
本手法の有効性はtaobao.comの実データに基づく広範囲な実験により検証された。
- 参考スコア(独自算出の注目度): 19.456109814747048
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recommender systems rely heavily on increasing computation resources to
improve their business goal. By deploying computation-intensive models and
algorithms, these systems are able to inference user interests and exhibit
certain ads or commodities from the candidate set to maximize their business
goals. However, such systems are facing two challenges in achieving their
goals. On the one hand, facing massive online requests, computation-intensive
models and algorithms are pushing their computation resources to the limit. On
the other hand, the response time of these systems is strictly limited to a
short period, e.g. 300 milliseconds in our real system, which is also being
exhausted by the increasingly complex models and algorithms.
In this paper, we propose the computation resource allocation solution (CRAS)
that maximizes the business goal with limited computation resources and
response time. We comprehensively illustrate the problem and formulate such a
problem as an optimization problem with multiple constraints, which could be
broken down into independent sub-problems. To solve the sub-problems, we
propose the revenue function to facilitate the theoretical analysis, and obtain
the optimal computation resource allocation strategy. To address the
applicability issues, we devise the feedback control system to help our
strategy constantly adapt to the changing online environment. The effectiveness
of our method is verified by extensive experiments based on the real dataset
from Taobao.com. We also deploy our method in the display advertising system of
Alibaba. The online results show that our computation resource allocation
solution achieves significant business goal improvement without any increment
of computation cost, which demonstrates the efficacy of our method in real
industrial practice.
- Abstract(参考訳): Recommenderシステムは、ビジネス目標を改善するために計算リソースを増やすことに大きく依存します。
計算集約型モデルとアルゴリズムを配置することで、これらのシステムはユーザーの興味を推論し、候補から特定の広告や商品を提示し、彼らのビジネス目標を最大化することができる。
しかし、これらのシステムは目標を達成する上で2つの課題に直面している。
一方、大規模なオンライン要求に直面した計算集約型モデルとアルゴリズムは、計算リソースを限界まで押し上げている。
一方、これらのシステムの応答時間は、例えば、短い期間に厳密に制限されている。
現実のシステムでは300ミリ秒、複雑なモデルやアルゴリズムによっても枯渇しています。
本稿では,限られた計算資源と応答時間でビジネス目標を最大化する計算資源割当ソリューション(CRAS)を提案する。
この問題を包括的に説明し、複数の制約を持つ最適化問題として、独立したサブプロブレムに分解できるような問題を定式化する。
サブプロブレムを解決するため,理論解析を容易にするための収益関数を提案し,最適な計算資源配分戦略を得る。
適用可能性問題に対処するため,我々は,オンライン環境の変化に常に適応するためのフィードバック制御システムを考案した。
本手法の有効性はtaobao.comの実データに基づく広範囲な実験により検証された。
また、Alibabaのディスプレイ広告システムにも導入しています。
オンラインの結果,計算資源割当ソリューションは,計算コストの増分を必要とせず,事業目標の大幅な改善を実現し,本手法の有効性を実証した。
関連論文リスト
- Reinforcement Learning for Adaptive Resource Scheduling in Complex System Environments [8.315191578007857]
そこで本研究では,Q-ラーニングに基づく新しいコンピュータシステムの性能最適化と適応型ワークロード管理スケジューリングアルゴリズムを提案する。
対照的に、強化学習アルゴリズムであるQラーニングは、システムの状態変化から継続的に学習し、動的スケジューリングとリソース最適化を可能にする。
この研究は、将来の大規模システムにおけるAI駆動適応スケジューリングの統合の基礎を提供し、システムのパフォーマンスを高め、運用コストを削減し、持続可能なエネルギー消費をサポートするスケーラブルでインテリジェントなソリューションを提供する。
論文 参考訳(メタデータ) (2024-11-08T05:58:09Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Multi-Resource Allocation for On-Device Distributed Federated Learning
Systems [79.02994855744848]
本研究は,デバイス上の分散フェデレーション学習(FL)システムにおいて,レイテンシとエネルギー消費の重み付け和を最小化する分散マルチリソース割り当て方式を提案する。
システム内の各モバイルデバイスは、指定された領域内でモデルトレーニングプロセスを実行し、それぞれパラメータの導出とアップロードを行うための計算と通信資源を割り当てる。
論文 参考訳(メタデータ) (2022-11-01T14:16:05Z) - Learning to Optimize Permutation Flow Shop Scheduling via Graph-based
Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。
我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。
我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文 参考訳(メタデータ) (2022-10-31T09:46:26Z) - Evolutionary Optimization for Proactive and Dynamic Computing Resource
Allocation in Open Radio Access Network [4.9711284100869815]
Open Radio Access Network (O-RAN) におけるコンピュータリソースの自動割り当てを実現するためのインテリジェントな技術が求められている
このリソース割り当て問題を解決するための既存の問題定式化は、リソースのキャパシティユーティリティを不適切な方法で定義しているため不適切である。
問題をよりよく記述した新しい定式化が提案されている。
論文 参考訳(メタデータ) (2022-01-12T08:52:04Z) - Dynamic neighbourhood optimisation for task allocation using multi-agent [0.0]
大規模システムでは、タスク割り当てに集中型技術を使用する場合、課題がある。
本稿では,これらの問題を解決する4つのアルゴリズムを提案する。
システム接続に影響を及ぼす場合、非知識保持アプローチよりも5倍のパフォーマンス回復を提供する。
論文 参考訳(メタデータ) (2021-02-16T17:49:14Z) - The Best of Many Worlds: Dual Mirror Descent for Online Allocation
Problems [7.433931244705934]
本稿では,意思決定者に対して未知の入力モデルを用いて,各要求に対する報酬とリソース消費を生成するデータ駆動型設定について考察する。
様々な入力モデルにおいて,どの入力に直面するかを知ることなく,優れた性能が得られるアルゴリズムの一般クラスを設計する。
我々のアルゴリズムはラグランジアン双対空間で動作し、オンラインミラー降下を用いて更新される各リソースに対して双対乗算器を保持する。
論文 参考訳(メタデータ) (2020-11-18T18:39:17Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Regularized Online Allocation Problems: Fairness and Beyond [7.433931244705934]
本稿では, 総資源消費に作用する非線形正規化器を含む変種である, 語彙化オンライン割当問題を紹介する。
この問題では、要求は時間とともに繰り返し届き、各要求に対して、意思決定者は報酬を生成しリソースを消費するアクションを取る必要があります。
目的は、資源制約を受ける加算可分な報酬と非分離可正則化器の値とを同時に最大化することである。
論文 参考訳(メタデータ) (2020-07-01T14:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。