論文の概要: Source Code Classification for Energy Efficiency in Parallel Ultra
Low-Power Microcontrollers
- arxiv url: http://arxiv.org/abs/2012.06836v1
- Date: Sat, 12 Dec 2020 15:12:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 06:47:35.572391
- Title: Source Code Classification for Energy Efficiency in Parallel Ultra
Low-Power Microcontrollers
- Title(参考訳): 並列超低消費電力マイクロコントローラにおけるエネルギー効率のソースコード分類
- Authors: Emanuele Parisi, Francesco Barchi, Andrea Bartolini, Giuseppe
Tagliavini, Andrea Acquaviva
- Abstract要約: 本稿では,ソフトウェアツールチェーンの知性を向上し,最新のアーキテクチャを最大限に活用することを目的とする。
低電力の並列組込みアーキテクチャの場合、これは、例えばコア数の観点から構成を見つけることを意味し、最小限のエネルギー消費につながる。
実験によれば、ソースコード上で機械学習モデルを使用して最適なエネルギースケーリング構成を自動的に選択することは可能であり、エネルギー最小化のための自動システム構成のコンテキストで使用できる可能性がある。
- 参考スコア(独自算出の注目度): 5.4352987210173955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The analysis of source code through machine learning techniques is an
increasingly explored research topic aiming at increasing smartness in the
software toolchain to exploit modern architectures in the best possible way. In
the case of low-power, parallel embedded architectures, this means finding the
configuration, for instance in terms of the number of cores, leading to minimum
energy consumption. Depending on the kernel to be executed, the energy optimal
scaling configuration is not trivial. While recent work has focused on
general-purpose systems to learn and predict the best execution target in terms
of the execution time of a snippet of code or kernel (e.g. offload OpenCL
kernel on multicore CPU or GPU), in this work we focus on static compile-time
features to assess if they can be successfully used to predict the minimum
energy configuration on PULP, an ultra-low-power architecture featuring an
on-chip cluster of RISC-V processors. Experiments show that using machine
learning models on the source code to select the best energy scaling
configuration automatically is viable and has the potential to be used in the
context of automatic system configuration for energy minimisation.
- Abstract(参考訳): 機械学習技術によるソースコードの分析は、現代のアーキテクチャを最大限に活用するためのソフトウェアツールチェーンの賢さ向上を目的とした、ますます検討されている研究テーマである。
低消費電力の並列組み込みアーキテクチャの場合、例えばコア数の観点から構成を見つけることを意味し、最小のエネルギー消費につながる。
実行すべきカーネルによっては、エネルギー最適スケーリング構成は自明ではない。
最近の研究は、コードやカーネルのスニペットの実行時間(例)で最高の実行目標を学習し、予測する汎用システムに焦点を当てている。
マルチコアCPUやGPUでOpenCLカーネルをオフロードする) この作業では、RISC-Vプロセッサのオンチップクラスタを特徴とする超低消費電力アーキテクチャであるPULPの最小エネルギー構成を予測できるかどうかを評価するために、静的コンパイル時機能に重点を置いている。
実験によれば、ソースコード上で機械学習モデルを使用して最適なエネルギースケーリング構成を自動的に選択することは可能であり、エネルギー最小化のための自動システム構成のコンテキストで使用できる可能性がある。
関連論文リスト
- Kernel Approximation using Analog In-Memory Computing [3.5231018007564203]
カーネル関数は、いくつかの機械学習アルゴリズムの重要な要素であるが、しばしば大きなメモリと計算コストを発生させる。
本稿では,混合信号アナログメモリ・コンピューティング(AIMC)アーキテクチャに適した機械学習アルゴリズムにおけるカーネル近似手法を提案する。
論文 参考訳(メタデータ) (2024-11-05T16:18:47Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - Power Constrained Autotuning using Graph Neural Networks [1.7188280334580197]
本稿では,最新のプロセッサ上での科学応用の性能,パワー,エネルギー効率を向上させるための,グラフニューラルネットワークに基づく新しい自動チューニング手法を提案する。
提案手法では,標準のOpenMP構成に対して,平均的な幾何的性能改善が25%以上,13%以上となる,異なる電力制約でOpenMP構成を識別する。
論文 参考訳(メタデータ) (2023-02-22T16:06:00Z) - Towards making the most of NLP-based device mapping optimization for
OpenCL kernels [5.6596607119831575]
我々は、加速されたOpenCLカーネルのための最適なデバイス選択(CPUまたはGPU)の問題に取り組むCummins et al.、すなわちDeeptuneの開発を拡張した。
ソースコードの文脈情報を拡張した4つの異なるモデルを提案する。
実験の結果,提案手法はCumminsらの手法を上回り,予測精度を最大4%向上させることがわかった。
論文 参考訳(メタデータ) (2022-08-30T10:20:55Z) - Towards Optimal VPU Compiler Cost Modeling by using Neural Networks to
Infer Hardware Performances [58.720142291102135]
VPUNN"は低レベルのタスクプロファイリングに基づいてトレーニングされたニューラルネットワークベースのコストモデルである。
これは、IntelのVPUプロセッサのラインにおける最先端のコストモデリングよりも一貫して優れている。
論文 参考訳(メタデータ) (2022-05-09T22:48:39Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Towards High Performance Relativistic Electronic Structure Modelling:
The EXP-T Program Package [68.8204255655161]
並列計算機用に設計されたFS-RCC方式の新たな実装を提案する。
実装のパフォーマンスとスケーリングの特徴を分析した。
開発されたソフトウェアは、重い超重核を含む原子や分子の性質を予測するための全く新しいレベルの精度を達成することができる。
論文 参考訳(メタデータ) (2020-04-07T20:08:30Z) - Towards automated kernel selection in machine learning systems: A SYCL
case study [0.0]
本稿では,ライブラリに高性能なSYCLカーネルをデプロイするケーススタディにおいて,機械学習を用いてカーネルの選択を行う。
自動チューニングと機械学習を組み合わせることで、これらのカーネル選択プロセスは、新しいハードウェアで高いパフォーマンスを達成するための開発者の努力をほとんど必要とせずにデプロイできる。
論文 参考訳(メタデータ) (2020-03-15T11:23:36Z) - On Coresets for Support Vector Machines [61.928187390362176]
coresetは、元のデータポイントの小さな、代表的なサブセットである。
我々は,本アルゴリズムを用いて,既製のSVMソルバをストリーミング,分散,動的データ設定に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-02-15T23:25:12Z) - PolyScientist: Automatic Loop Transformations Combined with Microkernels
for Optimization of Deep Learning Primitives [55.79741270235602]
深層学習カーネル開発のためのハイブリッドソリューションを開発する。
我々は、高度な多面体技術を用いて、パフォーマンスのために外部ループを自動的に調整する。
論文 参考訳(メタデータ) (2020-02-06T08:02:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。