論文の概要: GreenFlow: A Computation Allocation Framework for Building
Environmentally Sound Recommendation System
- arxiv url: http://arxiv.org/abs/2312.16176v1
- Date: Fri, 15 Dec 2023 07:26:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-31 02:59:14.530747
- Title: GreenFlow: A Computation Allocation Framework for Building
Environmentally Sound Recommendation System
- Title(参考訳): GreenFlow:環境音推薦システム構築のための計算割当フレームワーク
- Authors: Xingyu Lu, Zhining Liu, Yanchu Guan, Hongxuan Zhang, Chenyi Zhuang,
Wenqi Ma, Yize Tan, Jinjie Gu, Guannan Zhang
- Abstract要約: 毎秒数十万のリクエストがある現実のシナリオでは、各リクエストに対してパーソナライズされた結果を推測するために、重要な計算が必要である。
提案するグリーンフローは, 推定における精度と二酸化炭素排出量の両立を考慮した, 実用的なアロケーションフレームワークである。
- 参考スコア(独自算出の注目度): 16.314929735748223
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Given the enormous number of users and items, industrial cascade
recommendation systems (RS) are continuously expanded in size and complexity to
deliver relevant items, such as news, services, and commodities, to the
appropriate users. In a real-world scenario with hundreds of thousands requests
per second, significant computation is required to infer personalized results
for each request, resulting in a massive energy consumption and carbon emission
that raises concern.
This paper proposes GreenFlow, a practical computation allocation framework
for RS, that considers both accuracy and carbon emission during inference. For
each stage (e.g., recall, pre-ranking, ranking, etc.) of a cascade RS, when a
user triggers a request, we define two actions that determine the computation:
(1) the trained instances of models with different computational complexity;
and (2) the number of items to be inferred in the stage. We refer to the
combinations of actions in all stages as action chains. A reward score is
estimated for each action chain, followed by dynamic primal-dual optimization
considering both the reward and computation budget. Extensive experiments
verify the effectiveness of the framework, reducing computation consumption by
41% in an industrial mobile application while maintaining commercial revenue.
Moreover, the proposed framework saves approximately 5000kWh of electricity and
reduces 3 tons of carbon emissions per day.
- Abstract(参考訳): 膨大な数のユーザとアイテムから、産業用カスケードレコメンデーションシステム(RS)は、ニュース、サービス、商品などの関連アイテムを適切なユーザーに届けるために、サイズと複雑さを継続的に拡張している。
毎秒数十万のリクエストがある現実のシナリオでは、各要求に対してパーソナライズされた結果を推測するために重要な計算が必要である。
本稿では,推論における精度と二酸化炭素排出量の両面を考慮した実測計算フレームワークであるGreenFlowを提案する。
カスケードRSの各ステージ(リコール、プレランク、ランキングなど)に対して、ユーザが要求をトリガーすると、計算を決定する2つのアクションを定義します。
すべてのステージにおけるアクションの組み合わせをアクションチェーンと呼びます。
各アクションチェーンに対して報酬スコアを推定し、次に報酬と計算予算の両方を考慮した動的原始双対最適化を行う。
大規模な実験により、このフレームワークの有効性が検証され、商用収益を維持しながら、産業用モバイルアプリケーションにおける計算消費を41%削減した。
さらに、提案手法は、約5000kWhの電力を節約し、1日あたり3トンの二酸化炭素排出量を削減する。
関連論文リスト
- RecFlow: An Industrial Full Flow Recommendation Dataset [66.06445386541122]
産業レコメンデーションシステムは、商品をユーザに届ける際の効率性と効率のバランスをとるために、多段階パイプラインに依存している。
オフラインRSベンチマークと実際のオンライン環境とのギャップを埋めるために設計された産業用フルフローレコメンデーションデータセットであるRecFlowを紹介します。
我々のデータセットは、約9万項目にわたる42Kユーザからの38万のインタラクションで構成され、37日間にわたる9.3Mオンラインリクエストから収集された1.9Bステージサンプルと6ステージにまたがる。
論文 参考訳(メタデータ) (2024-10-28T09:36:03Z) - PAIL: Performance based Adversarial Imitation Learning Engine for Carbon Neutral Optimization [42.9492993819955]
既存のDeep Reinforcement Learning (DRL) 手法では、それぞれのアクションが最終的な持続可能な開発目標に与える影響を評価するために、事前に定義された報酬関数が必要である。
本研究では,PAIL(Performance Based Adversarial Learning)エンジンを提案する。
これは、事前に定義されたアクション報酬を伴わずに、炭素中立性のための最適な操作ポリシーを取得するための新しい方法である。
論文 参考訳(メタデータ) (2024-07-12T01:06:01Z) - Power Hungry Processing: Watts Driving the Cost of AI Deployment? [74.19749699665216]
生成された多目的AIシステムは、機械学習(ML)モデルをテクノロジに構築するための統一的なアプローチを約束する。
この「一般性」の野心は、これらのシステムが必要とするエネルギー量と放出する炭素量を考えると、環境に急激なコストがかかる。
これらのモデルを用いて,代表的なベンチマークデータセット上で1,000の推論を行うのに必要なエネルギーと炭素の量として,デプロイメントコストを測定した。
本稿は、多目的MLシステムの展開動向に関する議論から締めくくり、エネルギーと排出の面でコストの増大に対して、その実用性はより意図的に重み付けされるべきである、と警告する。
論文 参考訳(メタデータ) (2023-11-28T15:09:36Z) - Efficient Prompting via Dynamic In-Context Learning [76.83516913735072]
ブラックボックスジェネリストモデルを用いた効率的なプロンプト法であるDynaICLを提案する。
DynaICLは入力複雑性と計算予算に応じてコンテキスト内の例を動的に割り当てる。
DynaICLは、各入力に同じテキスト内サンプルを割り当てる一般的な慣行と比較して、最大46%のトークン予算を節約している。
論文 参考訳(メタデータ) (2023-05-18T17:58:31Z) - Movement Penalized Bayesian Optimization with Application to Wind Energy
Systems [84.7485307269572]
文脈ベイズ最適化(CBO)は、与えられた側情報を逐次決定する強力なフレームワークである。
この設定では、学習者は各ラウンドでコンテキスト(天気条件など)を受け取り、アクション(タービンパラメータなど)を選択する必要がある。
標準的なアルゴリズムは、すべてのラウンドで意思決定を切り替えるコストを前提としませんが、多くの実用的なアプリケーションでは、このような変更に関連するコストが最小化されるべきです。
論文 参考訳(メタデータ) (2022-10-14T20:19:32Z) - Should All Proposals be Treated Equally in Object Detection? [110.27485090952385]
オブジェクト検出器の複雑さと精度のトレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。
検出効率の改善には、提案の不平等な処理に向けて、パラダイムシフトが必要であると仮定されている。
これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
論文 参考訳(メタデータ) (2022-07-07T18:26:32Z) - iX-BSP: Incremental Belief Space Planning [14.62008690460147]
計画セッション全体の計算が本質的に類似しており、適切に再使用できるという重要な洞察に基づいて、新しいパラダイムであるIncremental BSPを提案します。
両手法を評価し,統計的に精度を保ちながら計算時間を大幅に削減することを示す。
論文 参考訳(メタデータ) (2021-02-18T18:35:14Z) - Green Algorithms: Quantifying the carbon footprint of computation [0.0]
本稿では,任意の計算タスクの炭素フットプリントを,標準化された信頼性の高い方法で推定する枠組みを提案する。
温室効果ガスの排出を解釈し、文脈的に解釈する指標が定義され、車や飛行機で走行する同等距離を含む。
我々は、ユーザが計算の炭素フットプリントを見積り、レポートできる、無料で利用可能なオンラインツールであるGreen Algorithmsを開発した。
論文 参考訳(メタデータ) (2020-07-15T11:05:33Z) - Highly Efficient Salient Object Detection with 100K Parameters [137.74898755102387]
そこで我々は,段階内および複数ステージのマルチスケール機能を効率的に活用するために,フレキシブルな畳み込みモジュールであるOctoConv(gOctConv)を提案する。
我々は、非常に軽量なモデル、すなわちCSNetを構築し、一般的なオブジェクト検出ベンチマークで、約0.2%(100k)の大規模モデルで同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-03-12T07:00:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。