論文の概要: Optimization of Heterogeneous Systems with AI Planning Heuristics and
Machine Learning: A Performance and Energy Aware Approach
- arxiv url: http://arxiv.org/abs/2106.01441v1
- Date: Wed, 2 Jun 2021 19:45:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-05 05:48:59.293324
- Title: Optimization of Heterogeneous Systems with AI Planning Heuristics and
Machine Learning: A Performance and Energy Aware Approach
- Title(参考訳): AI計画ヒューリスティックと機械学習による異種システムの最適化:性能とエネルギー意識のアプローチ
- Authors: Suejb Memeti and Sabri Pllana
- Abstract要約: 不均一コンピューティングシステムは高い性能とエネルギー効率を提供する。
このようなシステムを最適に活用するには、ホストCPUとアクセラレーションデバイスにまたがるソリューションが必要である。
本稿では,パラメータ空間探索のためのAI計画と,性能とエネルギー評価のための機械学習モデルを組み合わせた,性能とエネルギーを考慮したアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heterogeneous computing systems provide high performance and energy
efficiency. However, to optimally utilize such systems, solutions that
distribute the work across host CPUs and accelerating devices are needed. In
this paper, we present a performance and energy aware approach that combines AI
planning heuristics for parameter space exploration with a machine learning
model for performance and energy evaluation to determine a near-optimal system
configuration. For data-parallel applications our approach determines a
near-optimal host-device distribution of work, number of processing units
required and the corresponding scheduling strategy. We evaluate our approach
for various heterogeneous systems accelerated with GPU or the Intel Xeon Phi.
The experimental results demonstrate that our approach finds a near-optimal
system configuration by evaluating only about 7% of reasonable configurations.
Furthermore, the performance per Joule estimation of system configurations
using our machine learning model is more than 1000x faster compared to the
system evaluation by program execution.
- Abstract(参考訳): ヘテロジニアスコンピューティングシステムは高性能でエネルギー効率が高い。
しかし、このようなシステムを最適に活用するには、ホストCPUと高速化デバイスに分散するソリューションが必要である。
本稿では、パラメータ空間探索のためのAI計画ヒューリスティックスと、性能とエネルギー評価のための機械学習モデルを組み合わせて、ほぼ最適システム構成を決定する性能とエネルギー意識のアプローチを提案する。
データ並列アプリケーションでは、作業のほぼ最適ホストデバイス分布、必要な処理ユニット数、それに対応するスケジューリング戦略を決定する。
我々はGPUやIntel Xeon Phiで高速化された異種システムに対するアプローチを評価する。
実験の結果, 合理的な構成の約7%しか評価せず, 最適に近いシステム構成が得られた。
さらに,機械学習モデルを用いたシステム構成のジュール当たりの性能推定は,プログラム実行によるシステム評価よりも1000倍以上高速である。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - CURE: Simulation-Augmented Auto-Tuning in Robotics [15.943773140929856]
本稿では、因果的な設定オプションを識別するCUREを提案する。
CUREは、様々な構成オプションとロボットのパフォーマンス目標との間の因果関係を抽象化する。
物理ロボットとシミュレーションの両方で実験を行うことにより,CUREの有効性と伝達性を示す。
論文 参考訳(メタデータ) (2024-02-08T04:27:14Z) - Design Space Exploration of Approximate Computing Techniques with a
Reinforcement Learning Approach [49.42371633618761]
精度劣化と消費電力と計算時間短縮のバランスをとるアプリケーションの近似バージョンを見つけるためのRLベースの戦略を提案する。
実験結果から,いくつかのベンチマークにおいて,精度劣化と消費電力減少と計算時間との良好なトレードオフが示された。
論文 参考訳(メタデータ) (2023-12-29T09:10:40Z) - Performance Tuning for GPU-Embedded Systems: Machine-Learning-based and
Analytical Model-driven Tuning Methodologies [0.0]
本研究は,分析モデル駆動型チューニング手法と機械学習(ML)に基づくチューニング手法を紹介する。
NVIDIA JetsonシステムにおけるBPLGライブラリの異なる並列プレフィックス実装のための2つのチューニング手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-10-24T22:09:03Z) - Hybrid Algorithm Selection and Hyperparameter Tuning on Distributed
Machine Learning Resources: A Hierarchical Agent-based Approach [0.0]
本稿では,分散された機械学習アルゴリズムを選択するための,完全自動協調型エージェントベース機構を提案する。
我々の解は完全に正解であり、利用可能な資源の大きさに関連して線形時間と空間の複雑さを示す。
論文 参考訳(メタデータ) (2023-09-12T21:07:23Z) - Reconfigurable Distributed FPGA Cluster Design for Deep Learning
Accelerators [59.11160990637615]
エッジコンピューティングアプリケーション用に設計された低消費電力組み込みFPGAに基づく分散システムを提案する。
提案システムは,様々なニューラルネットワーク(NN)モデルを同時に実行し,パイプライン構造にグラフを配置し,NNグラフの最も計算集約的な層により大きなリソースを手動で割り当てる。
論文 参考訳(メタデータ) (2023-05-24T16:08:55Z) - Automated Evolutionary Approach for the Design of Composite Machine
Learning Pipelines [48.7576911714538]
提案手法は、複合機械学習パイプラインの設計を自動化することを目的としている。
パイプラインをカスタマイズ可能なグラフベースの構造で設計し、得られた結果を分析して再生する。
このアプローチのソフトウェア実装は、オープンソースフレームワークとして紹介されている。
論文 参考訳(メタデータ) (2021-06-26T23:19:06Z) - MLComp: A Methodology for Machine Learning-based Performance Estimation
and Adaptive Selection of Pareto-Optimal Compiler Optimization Sequences [10.200899224740871]
組込みソフトウェア最適化のための新しい強化学習型ポリシー手法を提案する。
異なる機械学習モデルが自動的にテストされ、最適なものを選択する。
また、ターゲットとするプラットフォームやアプリケーションドメインに対して、フレームワークを効率的にトレーニングできることも示しています。
論文 参考訳(メタデータ) (2020-12-09T19:13:39Z) - Bilevel Optimization: Convergence Analysis and Enhanced Design [63.64636047748605]
バイレベル最適化は多くの機械学習問題に対するツールである。
Stoc-BiO という新しい確率効率勾配推定器を提案する。
論文 参考訳(メタデータ) (2020-10-15T18:09:48Z) - Bayesian Optimization for Selecting Efficient Machine Learning Models [53.202224677485525]
本稿では,予測効率とトレーニング効率の両面において,モデルを協調最適化するための統一ベイズ最適化フレームワークを提案する。
レコメンデーションタスクのためのモデル選択の実験は、この方法で選択されたモデルがモデルのトレーニング効率を大幅に改善することを示している。
論文 参考訳(メタデータ) (2020-08-02T02:56:30Z) - Optimizing Streaming Parallelism on Heterogeneous Many-Core
Architectures: A Machine Learning Based Approach [16.702537371391053]
本稿では、異種多コアアーキテクチャ上のタスクベース並列アプリケーションにおいて、ハードウェアリソース分割とタスク粒度に関する優れたソリューションを導出する自動手法を提案する。
提案手法では,与えられたリソース分割とタスクの粒度設定に基づいて,対象アプリケーションの結果のパフォーマンスを推定するために,性能モデルを用いる。
シングルストリームバージョンと比較すると,XeonPhiとGPUプラットフォームでそれぞれ1.6倍,1.1倍の高速化を実現している。
論文 参考訳(メタデータ) (2020-03-05T21:18:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。