論文の概要: SCOPE: Safe Exploration for Dynamic Computer Systems Optimization
- arxiv url: http://arxiv.org/abs/2204.10451v1
- Date: Fri, 22 Apr 2022 00:58:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-26 00:32:52.274722
- Title: SCOPE: Safe Exploration for Dynamic Computer Systems Optimization
- Title(参考訳): SCOPE:動的コンピュータシステム最適化のための安全な探索
- Authors: Hyunji Kim, Ahsan Pervaiz, Henry Hoffmann, Michael Carbin, Yi Ding
- Abstract要約: 本稿では,実行空間からハードウェアリソースを動的に割り当てるリソースマネージャSCOPEを提案する。
電力制約違反を最小限に抑えながら、SCOPEのレイテンシ向上能力を評価する。
- 参考スコア(独自算出の注目度): 18.498208917123414
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern computer systems need to execute under strict safety constraints
(e.g., a power limit), but doing so often conflicts with their ability to
deliver high performance (i.e. minimal latency). Prior work uses machine
learning to automatically tune hardware resources such that the system
execution meets safety constraints optimally. Such solutions monitor past
system executions to learn the system's behavior under different hardware
resource allocations before dynamically tuning resources to optimize the
application execution. However, system behavior can change significantly
between different applications and even different inputs of the same
applications. Hence, the models learned using data collected a priori are often
suboptimal and violate safety constraints when used with new applications and
inputs. To address this limitation, we introduce the concept of an execution
space, which is the cross product of hardware resources, input features, and
applications. To dynamically and safely allocate hardware resources from the
execution space, we present SCOPE, a resource manager that leverages a novel
safe exploration framework. We evaluate SCOPE's ability to deliver improved
latency while minimizing power constraint violations by dynamically configuring
hardware while running a variety of Apache Spark applications. Compared to
prior approaches that minimize power constraint violations, SCOPE consumes
comparable power while improving latency by up to 9.5X. Compared to prior
approaches that minimize latency, SCOPE achieves similar latency but reduces
power constraint violation rates by up to 45.88X, achieving almost zero safety
constraint violations across all applications.
- Abstract(参考訳): 現代のコンピュータシステムは厳格な安全性の制約(電力制限など)の下で実行する必要があるが、高い性能(すなわち最小のレイテンシ)を提供する能力と相反することが多い。
以前の作業では、機械学習を使用して、システム実行が安全上の制約を最適に満たすように、ハードウェアリソースを自動チューニングする。
このようなソリューションは過去のシステム実行を監視し、異なるハードウェアリソース割り当ての下でシステムの振る舞いを学習した後、動的にリソースをチューニングしてアプリケーション実行を最適化します。
しかし、システム動作は異なるアプリケーションと、同じアプリケーションの異なる入力の間で大きく変化する可能性がある。
したがって、事前に収集したデータを用いて学習したモデルは、しばしば準最適であり、新しいアプリケーションや入力で使用する場合の安全性の制約に違反する。
この制限に対処するため,ハードウェアリソース,入力機能,アプリケーションのクロス製品である実行空間の概念を導入する。
ハードウェアリソースを動的かつ安全に実行空間から割り当てるために,新しい安全な探索フレームワークを活用した資源マネージャSCOPEを提案する。
我々は、さまざまなapache sparkアプリケーションを実行しながらハードウェアを動的に構成することで、パワー制約違反を最小限に抑えながら、レイテンシーを改善するスコープの能力を評価する。
電力制約違反を最小限に抑える以前のアプローチと比較して、SCOPEは9.5Xまでのレイテンシを改善しながら、同等の電力を消費する。
レイテンシを最小化する従来のアプローチと比較して、SCOPEは同様のレイテンシを実現するが、電力制約違反率を最大45.88倍に削減し、すべてのアプリケーションに対してほぼゼロの安全性制約違反を実現する。
関連論文リスト
- CUAOA: A Novel CUDA-Accelerated Simulation Framework for the QAOA [3.757262277494307]
量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、最適化問題の近似解を見つけるために設計された顕著な量子アルゴリズムである。
既存の最先端のシミュレーションフレームワークは、長い実行時間や包括的な機能が欠如している。
ランタイム・ザ・アート・ツールキットを用いたGPUアクセラレーションQAOAシミュレーションフレームワークを開発した。
論文 参考訳(メタデータ) (2024-07-17T21:06:18Z) - Dynamic DNNs and Runtime Management for Efficient Inference on
Mobile/Embedded Devices [2.8851756275902476]
ディープニューラルネットワーク(DNN)推論は、モバイルおよび組み込みプラットフォームでますます実行されています。
システムレベルの性能とエネルギー効率を最大化する新しいDynamic Super-Networksを共同で設計した。
SOTAと比較すると、Jetson Xavier NXのGPU上でのImageNetを用いた実験結果は、類似のImageNet Top-1精度で2.4倍、類似のレイテンシで5.1%高速であることを示している。
論文 参考訳(メタデータ) (2024-01-17T04:40:30Z) - Action-Quantized Offline Reinforcement Learning for Robotic Skill
Learning [68.16998247593209]
オフライン強化学習(RL)パラダイムは、静的な行動データセットを、データを収集したポリシーよりも優れたパフォーマンスのポリシーに変換するためのレシピを提供する。
本稿では,アクション量子化のための適応型スキームを提案する。
IQL,CQL,BRACといった最先端のオフラインRL手法が,提案手法と組み合わせることで,ベンチマークのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-10-18T06:07:10Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - DynaMIX: Resource Optimization for DNN-Based Real-Time Applications on a
Multi-Tasking System [20.882393722208608]
より多くのディープニューラルネットワーク(DNN)が開発され、自律走行車(AV)に配備されている。
期待と要求の高まりに応えるため、AVは、複数の車載アプリに対して、制限されたオンボードコンピューティングリソースを"最適化"する必要がある。
並列アプリケーションのリソース要件を最適化し,実行精度を最大化するDynamixを提案する。
論文 参考訳(メタデータ) (2023-02-03T06:33:28Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - FELARE: Fair Scheduling of Machine Learning Applications on
Heterogeneous Edge Systems [5.165692107696155]
エッジコンピューティングは、レイテンシに敏感な機械学習(ML)アプリケーションの同時実行と継続的実行を通じて、スマートIoTベースのシステムを実現する。
エネルギー制約を考慮しつつ、リアルタイムタスク完了率を向上させるリソース割当ソリューションを検討、分析する。
作業完了率の8.9%,省エネ率の12.6%はエッジシステムに大きなオーバーヘッドを伴わずに改善した。
論文 参考訳(メタデータ) (2022-05-31T19:19:40Z) - Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文 参考訳(メタデータ) (2022-01-13T15:20:45Z) - Intelligent colocation of HPC workloads [0.0]
多くのHPCアプリケーションは、共有キャッシュ、命令実行ユニット、I/O、メモリ帯域幅のボトルネックに苦しんでいる。
開発者やランタイムシステムにとって、すべての重要なリソースが単一のアプリケーションによって完全に悪用されることを保証するのは難しいため、魅力的なテクニックは、複数のアプリケーションを同じサーバに配置することです。
まず,ハードウェアの性能カウンタに基づいて,コロケーションされたアプリケーションの性能劣化をモデル化することにより,サーバ効率を向上できることを示す。
論文 参考訳(メタデータ) (2021-03-16T12:35:35Z) - EdgeBERT: Sentence-Level Energy Optimizations for Latency-Aware
Multi-Task NLP Inference [82.1584439276834]
BERTのようなトランスフォーマーベースの言語モデルでは、自然言語処理(NLP)タスクの精度が大幅に向上する。
We present EdgeBERT, a in-deepth algorithm- hardware co-design for latency-aware energy optimization for multi-task NLP。
論文 参考訳(メタデータ) (2020-11-28T19:21:47Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。