Fugu-MT 論文翻訳(概要): SCOPE: Safe Exploration for Dynamic Computer Systems Optimization

論文の概要: SCOPE: Safe Exploration for Dynamic Computer Systems Optimization

arxiv url: http://arxiv.org/abs/2204.10451v1
Date: Fri, 22 Apr 2022 00:58:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-26 00:32:52.274722
Title: SCOPE: Safe Exploration for Dynamic Computer Systems Optimization
Title（参考訳）: SCOPE:動的コンピュータシステム最適化のための安全な探索
Authors: Hyunji Kim, Ahsan Pervaiz, Henry Hoffmann, Michael Carbin, Yi Ding
Abstract要約: 本稿では,実行空間からハードウェアリソースを動的に割り当てるリソースマネージャSCOPEを提案する。電力制約違反を最小限に抑えながら、SCOPEのレイテンシ向上能力を評価する。
参考スコア（独自算出の注目度）: 18.498208917123414
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Modern computer systems need to execute under strict safety constraints (e.g., a power limit), but doing so often conflicts with their ability to deliver high performance (i.e. minimal latency). Prior work uses machine learning to automatically tune hardware resources such that the system execution meets safety constraints optimally. Such solutions monitor past system executions to learn the system's behavior under different hardware resource allocations before dynamically tuning resources to optimize the application execution. However, system behavior can change significantly between different applications and even different inputs of the same applications. Hence, the models learned using data collected a priori are often suboptimal and violate safety constraints when used with new applications and inputs. To address this limitation, we introduce the concept of an execution space, which is the cross product of hardware resources, input features, and applications. To dynamically and safely allocate hardware resources from the execution space, we present SCOPE, a resource manager that leverages a novel safe exploration framework. We evaluate SCOPE's ability to deliver improved latency while minimizing power constraint violations by dynamically configuring hardware while running a variety of Apache Spark applications. Compared to prior approaches that minimize power constraint violations, SCOPE consumes comparable power while improving latency by up to 9.5X. Compared to prior approaches that minimize latency, SCOPE achieves similar latency but reduces power constraint violation rates by up to 45.88X, achieving almost zero safety constraint violations across all applications.
Abstract（参考訳）: 現代のコンピュータシステムは厳格な安全性の制約(電力制限など)の下で実行する必要があるが、高い性能(すなわち最小のレイテンシ)を提供する能力と相反することが多い。以前の作業では、機械学習を使用して、システム実行が安全上の制約を最適に満たすように、ハードウェアリソースを自動チューニングする。このようなソリューションは過去のシステム実行を監視し、異なるハードウェアリソース割り当ての下でシステムの振る舞いを学習した後、動的にリソースをチューニングしてアプリケーション実行を最適化します。しかし、システム動作は異なるアプリケーションと、同じアプリケーションの異なる入力の間で大きく変化する可能性がある。したがって、事前に収集したデータを用いて学習したモデルは、しばしば準最適であり、新しいアプリケーションや入力で使用する場合の安全性の制約に違反する。この制限に対処するため,ハードウェアリソース,入力機能,アプリケーションのクロス製品である実行空間の概念を導入する。ハードウェアリソースを動的かつ安全に実行空間から割り当てるために,新しい安全な探索フレームワークを活用した資源マネージャSCOPEを提案する。我々は、さまざまなapache sparkアプリケーションを実行しながらハードウェアを動的に構成することで、パワー制約違反を最小限に抑えながら、レイテンシーを改善するスコープの能力を評価する。電力制約違反を最小限に抑える以前のアプローチと比較して、SCOPEは9.5Xまでのレイテンシを改善しながら、同等の電力を消費する。レイテンシを最小化する従来のアプローチと比較して、SCOPEは同様のレイテンシを実現するが、電力制約違反率を最大45.88倍に削減し、すべてのアプリケーションに対してほぼゼロの安全性制約違反を実現する。

関連論文リスト

CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文参考訳（メタデータ） (2025-08-15T07:49:22Z)
BanditWare: A Contextual Bandit-based Framework for Hardware Prediction [0.0]
BanditWareは、アプリケーションに適したハードウェアを動的に選択するオンラインレコメンデーションシステムである。従来の統計的および機械学習のアプローチとは異なり、BanditWareはオンラインで、新しいワークロードが到着すると学習と適応をリアルタイムで行う。
論文参考訳（メタデータ） (2025-06-16T17:40:34Z)
DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文参考訳（メタデータ） (2025-06-13T05:01:09Z)
Adaptive Budgeted Multi-Armed Bandits for IoT with Dynamic Resource Constraints [5.694070924765916]
モノのインターネットシステムは、変動するリソース制約を管理しながら、デバイスがリアルタイムで応答しなければならない環境でますます運用される。動的動作制限のあるIoTアプリケーションに適した,新しいBudgeted Multi-Armed Banditフレームワークを提案する。このモデルでは,学習過程の早い段階で制限された制約違反を許容し,時間とともに厳格なコンプライアンスを徐々に実施する,崩壊する違反予算を導入している。
論文参考訳（メタデータ） (2025-05-05T13:33:39Z)
Benchmarking Dynamic SLO Compliance in Distributed Computing Continuum Systems [9.820223170841219]
大規模アーキテクチャにおけるサービスレベルオブジェクト(SLO)は、その異種性やさまざまなサービス要件のために困難である。神経科学の新しい手法であるActive Inferenceのベンチマークを、3つの確立された強化学習アルゴリズムに対して提示する。アクティブ推論はDCCSにおけるSLOコンプライアンスを保証するための有望なアプローチであり、低メモリ使用率、安定したCPU利用、高速収束を提供する。
論文参考訳（メタデータ） (2025-03-05T08:56:26Z)
EdgeMLBalancer: A Self-Adaptive Approach for Dynamic Model Switching on Resource-Constrained Edge Devices [0.0]
エッジデバイス上の機械学習は、リソース制約のある環境でリアルタイムAIアプリケーションを可能にする。計算資源を管理する既存のソリューションは、しばしば正確さやエネルギー効率に焦点を絞っている。エッジデバイス上でのCPU利用とリソース管理を最適化する自己適応型アプローチを提案する。
論文参考訳（メタデータ） (2025-02-10T14:11:29Z)
Secure Resource Allocation via Constrained Deep Reinforcement Learning [49.15061461220109]
リソース割り当て、タスクオフロード、セキュリティ、パフォーマンスのバランスをとるフレームワークであるSARMTOを紹介します。 SARMTOは5つのベースラインアプローチを一貫して上回り、最大40%のシステムコスト削減を実現している。これらの拡張は、複雑な分散コンピューティング環境におけるリソース管理に革命をもたらすSARMTOの可能性を強調している。
論文参考訳（メタデータ） (2025-01-20T15:52:43Z)
CUAOA: A Novel CUDA-Accelerated Simulation Framework for the QAOA [3.757262277494307]
量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、最適化問題の近似解を見つけるために設計された顕著な量子アルゴリズムである。既存の最先端のシミュレーションフレームワークは、長い実行時間や包括的な機能が欠如している。ランタイム・ザ・アート・ツールキットを用いたGPUアクセラレーションQAOAシミュレーションフレームワークを開発した。
論文参考訳（メタデータ） (2024-07-17T21:06:18Z)
Efficiently Training Deep-Learning Parametric Policies using Lagrangian Duality [55.06411438416805]
制約付きマルコフ決定プロセス(CMDP)は、多くの高度な応用において重要である。本稿では,パラメトリックアクターポリシーを効率的に訓練するための2段階深度決定規則(TS-DDR)を提案する。現状の手法と比較して, 解の質を高め, 数桁の計算時間を削減できることが示されている。
論文参考訳（メタデータ） (2024-05-23T18:19:47Z)
Dynamic DNNs and Runtime Management for Efficient Inference on Mobile/Embedded Devices [2.8851756275902476]
ディープニューラルネットワーク(DNN)推論は、モバイルおよび組み込みプラットフォームでますます実行されています。システムレベルの性能とエネルギー効率を最大化する新しいDynamic Super-Networksを共同で設計した。 SOTAと比較すると、Jetson Xavier NXのGPU上でのImageNetを用いた実験結果は、類似のImageNet Top-1精度で2.4倍、類似のレイテンシで5.1%高速であることを示している。
論文参考訳（メタデータ） (2024-01-17T04:40:30Z)
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning [68.16998247593209]
オフライン強化学習(RL)パラダイムは、静的な行動データセットを、データを収集したポリシーよりも優れたパフォーマンスのポリシーに変換するためのレシピを提供する。本稿では,アクション量子化のための適応型スキームを提案する。 IQL,CQL,BRACといった最先端のオフラインRL手法が,提案手法と組み合わせることで,ベンチマークのパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2023-10-18T06:07:10Z)
Energy-efficient Task Adaptation for NLP Edge Inference Leveraging Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文参考訳（メタデータ） (2023-03-25T14:40:59Z)
DynaMIX: Resource Optimization for DNN-Based Real-Time Applications on a Multi-Tasking System [20.882393722208608]
より多くのディープニューラルネットワーク(DNN)が開発され、自律走行車(AV)に配備されている。期待と要求の高まりに応えるため、AVは、複数の車載アプリに対して、制限されたオンボードコンピューティングリソースを"最適化"する必要がある。並列アプリケーションのリソース要件を最適化し,実行精度を最大化するDynamixを提案する。
論文参考訳（メタデータ） (2023-02-03T06:33:28Z)
Log Barriers for Safe Black-box Optimization with Application to Safe Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。 LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文参考訳（メタデータ） (2022-07-21T11:14:47Z)
FELARE: Fair Scheduling of Machine Learning Applications on Heterogeneous Edge Systems [5.165692107696155]
エッジコンピューティングは、レイテンシに敏感な機械学習(ML)アプリケーションの同時実行と継続的実行を通じて、スマートIoTベースのシステムを実現する。エネルギー制約を考慮しつつ、リアルタイムタスク完了率を向上させるリソース割当ソリューションを検討、分析する。作業完了率の8.9%,省エネ率の12.6%はエッジシステムに大きなオーバーヘッドを伴わずに改善した。
論文参考訳（メタデータ） (2022-05-31T19:19:40Z)
Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for 5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文参考訳（メタデータ） (2022-01-13T15:20:45Z)
Intelligent colocation of HPC workloads [0.0]
多くのHPCアプリケーションは、共有キャッシュ、命令実行ユニット、I/O、メモリ帯域幅のボトルネックに苦しんでいる。開発者やランタイムシステムにとって、すべての重要なリソースが単一のアプリケーションによって完全に悪用されることを保証するのは難しいため、魅力的なテクニックは、複数のアプリケーションを同じサーバに配置することです。まず,ハードウェアの性能カウンタに基づいて,コロケーションされたアプリケーションの性能劣化をモデル化することにより,サーバ効率を向上できることを示す。
論文参考訳（メタデータ） (2021-03-16T12:35:35Z)
EdgeBERT: Sentence-Level Energy Optimizations for Latency-Aware Multi-Task NLP Inference [82.1584439276834]
BERTのようなトランスフォーマーベースの言語モデルでは、自然言語処理(NLP)タスクの精度が大幅に向上する。 We present EdgeBERT, a in-deepth algorithm- hardware co-design for latency-aware energy optimization for multi-task NLP。
論文参考訳（メタデータ） (2020-11-28T19:21:47Z)
Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文参考訳（メタデータ） (2020-02-22T10:15:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。