論文の概要: HDCC: A Hyperdimensional Computing compiler for classification on
embedded systems and high-performance computing
- arxiv url: http://arxiv.org/abs/2304.12398v1
- Date: Mon, 24 Apr 2023 19:16:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 22:54:20.540940
- Title: HDCC: A Hyperdimensional Computing compiler for classification on
embedded systems and high-performance computing
- Title(参考訳): HDCC:組み込みシステムと高性能コンピューティングの分類のための超次元計算コンパイラ
- Authors: Pere Verg\'es, Mike Heddes, Igor Nunes, Tony Givargis, Alexandru
Nicolau
- Abstract要約: この研究は、HDC分類メソッドの高レベルな記述を最適化されたCコードに変換する最初のオープンソースコンパイラである、ネームコンパイラを紹介している。
nameは現代のコンパイラのように設計されており、直感的で記述的な入力言語、中間表現(IR)、再ターゲット可能なバックエンドを備えている。
これらの主張を裏付けるために,HDC文献で最もよく使われているデータセットについて,HDCCを用いて実験を行った。
- 参考スコア(独自算出の注目度): 58.720142291102135
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hyperdimensional Computing (HDC) is a bio-inspired computing framework that
has gained increasing attention, especially as a more efficient approach to
machine learning (ML). This work introduces the \name{} compiler, the first
open-source compiler that translates high-level descriptions of HDC
classification methods into optimized C code. The code generated by the
proposed compiler has three main features for embedded systems and
High-Performance Computing: (1) it is self-contained and has no library or
platform dependencies; (2) it supports multithreading and single instruction
multiple data (SIMD) instructions using C intrinsics; (3) it is optimized for
maximum performance and minimal memory usage. \name{} is designed like a modern
compiler, featuring an intuitive and descriptive input language, an
intermediate representation (IR), and a retargetable backend. This makes
\name{} a valuable tool for research and applications exploring HDC for
classification tasks on embedded systems and High-Performance Computing. To
substantiate these claims, we conducted experiments with HDCC on several of the
most popular datasets in the HDC literature. The experiments were run on four
different machines, including different hyperparameter configurations, and the
results were compared to a popular prototyping library built on PyTorch. The
results show a training and inference speedup of up to 132x, averaging 25x
across all datasets and machines. Regarding memory usage, using
10240-dimensional hypervectors, the average reduction was 5x, reaching up to
14x. When considering vectors of 64 dimensions, the average reduction was 85x,
with a maximum of 158x less memory utilization.
- Abstract(参考訳): 超次元コンピューティング(HDC)はバイオインスパイアされたコンピューティングフレームワークであり、特に機械学習(ML)に対するより効率的なアプローチとして注目を集めている。
これは、HDC分類メソッドの高レベルな記述を最適化されたCコードに変換する最初のオープンソースコンパイラである。
コンパイラが生成するコードには,組み込みシステムと高性能コンピューティングの3つの主な特徴がある。(1)自己完結型であり,ライブラリやプラットフォームに依存しない,(2)c組み込みを用いたマルチスレッドおよびシングル命令マルチデータ(simd)命令をサポートする,(3)最大パフォーマンスとメモリ使用量に最適化されている。
\name{}は現代のコンパイラのように設計されており、直感的で記述的な入力言語、中間表現(IR)、再ターゲット可能なバックエンドを備えている。
これにより \name{} は、組み込みシステムや高性能コンピューティング上の分類タスクのための HDC を探索する研究やアプリケーションにとって貴重なツールとなる。
これらの主張を裏付けるために,HDC文献で最もよく使われているデータセットについて,HDCCを用いて実験を行った。
実験は、異なるハイパーパラメータ構成を含む4つの異なるマシンで実行され、PyTorch上に構築された一般的なプロトタイピングライブラリと比較された。
その結果、トレーニングと推論のスピードアップが最大132倍になり、すべてのデータセットとマシン平均25倍になった。
メモリ使用量については,10240次元ハイパーベクターを用いて平均5倍,最大14倍となった。
64次元のベクトルを考慮すると、平均減算は85倍となり、最大で158倍のメモリ使用率となった。
関連論文リスト
- Register Your Forests: Decision Tree Ensemble Optimization by Explicit CPU Register Allocation [3.737361598712633]
本稿では,決定木アンサンブルに対するコード生成手法を提案し,単一の変換ステップ内で機械組立コードを生成する。
その結果,決定木アンサンブル推論の性能は大幅に向上できることが示唆された。
論文 参考訳(メタデータ) (2024-04-10T09:17:22Z) - INR-Arch: A Dataflow Architecture and Compiler for Arbitrary-Order
Gradient Computations in Implicit Neural Representation Processing [66.00729477511219]
計算グラフとして表される関数を考えると、従来のアーキテクチャはn階勾配を効率的に計算する上で困難に直面している。
InR-Archは,n階勾配の計算グラフをハードウェア最適化データフローアーキテクチャに変換するフレームワークである。
1.8-4.8x と 1.5-3.6x の高速化を CPU と GPU のベースラインと比較した結果を示す。
論文 参考訳(メタデータ) (2023-08-11T04:24:39Z) - PowerFusion: A Tensor Compiler with Explicit Data Movement Description
and Instruction-level Graph IR [10.059491353103526]
本稿では,メモリ集約演算子のための高性能コードを生成するテンソルコンパイラであるIntelliGenを提案する。
IntelliGenは計算とデータ移動の最適化の両方を考慮する。
NVIDIA GPU、AMD GPU、Cambricon MLU上でIntelliGenを評価し、平均で1.97x、2.93x、16.91x(1.28x、1.23x、2.31x)までスピードアップした。
論文 参考訳(メタデータ) (2023-07-11T03:17:40Z) - Evaluation of OpenAI Codex for HPC Parallel Programming Models Kernel
Generation [1.7646846505225735]
高性能コンピューティングにおける基本数値カーネル上でのAI支援生成能力の評価を行った。
生成したカーネルコードを様々な言語対応プログラミングモデルでテストする。
本稿では,各プロンプトに対して与えられた10のプロンプトに関する習熟度尺度を提案する。
論文 参考訳(メタデータ) (2023-06-27T00:11:31Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - An Extension to Basis-Hypervectors for Learning from Circular Data in
Hyperdimensional Computing [62.997667081978825]
超次元計算(Hyperdimensional Computing、HDC)は、高次元ランダム空間の性質に基づく計算フレームワークである。
本稿では, 基本超ベクトル集合について検討し, 一般にHDCへの実践的貢献につながっている。
本稿では,HDCを用いた機械学習において,これまでに扱ったことのない重要な情報である円形データから学習する手法を提案する。
論文 参考訳(メタデータ) (2022-05-16T18:04:55Z) - Understanding Hyperdimensional Computing for Parallel Single-Pass
Learning [47.82940409267635]
我々はHDCがハードウェア効率を保ちながら、最先端のHDCモデルよりも最大7.6%性能が高いことを示す。
本稿では,HDC の限界を超える新しいクラス VSA,有限群 VSA を提案する。
実験の結果, RFF法とグループVSAはともに最先端HDCモデルより最大7.6%優れていた。
論文 参考訳(メタデータ) (2022-02-10T02:38:56Z) - Brain-inspired Cognition in Next Generation Racetrack Memories [0.6850683267295249]
超次元コンピューティング(Hyperdimensional Computing、HDC)は、認知をエミュレートするために数千次元のベクトルで動く脳にインスパイアされた新しい計算フレームワークである。
本稿では,レーストラックメモリ(RTM)をベースとして,メモリ内のHDCフレームワーク全体の実行と高速化を行うアーキテクチャを提案する。
提案手法では、最小限のCMOS回路が必要であり、Transverse Read (TR) と呼ばれるRTM内の複数の領域にまたがる読み出し演算を用いて排他的または追加操作を実現する。
論文 参考訳(メタデータ) (2021-11-03T14:21:39Z) - PolyDL: Polyhedral Optimizations for Creation of High Performance DL
primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。
我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。
また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-02T06:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。