論文の概要: GPU-RANC: A CUDA Accelerated Simulation Framework for Neuromorphic Architectures
- arxiv url: http://arxiv.org/abs/2404.16208v1
- Date: Wed, 24 Apr 2024 21:08:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-26 15:27:26.437160
- Title: GPU-RANC: A CUDA Accelerated Simulation Framework for Neuromorphic Architectures
- Title(参考訳): GPU-RANC:ニューロモルフィックアーキテクチャのためのCUDA加速シミュレーションフレームワーク
- Authors: Sahil Hassan, Michael Inouye, Miguel C. Gonzalez, Ilkin Aliyev, Joshua Mack, Maisha Hafiz, Ali Akoglu,
- Abstract要約: ニューロモーフィックコンピューティングのための再構成可能なアーキテクチャ(RANC)のGPUによる実装について紹介する。
512個のニューロモルフィックコアMNIST推論アプリケーションに基づくRANCシミュレータのシリアルバージョンと比較して,最大780倍の高速化を示した。
- 参考スコア(独自算出の注目度): 1.3401966602181168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-source simulation tools play a crucial role for neuromorphic application engineers and hardware architects to investigate performance bottlenecks and explore design optimizations before committing to silicon. Reconfigurable Architecture for Neuromorphic Computing (RANC) is one such tool that offers ability to execute pre-trained Spiking Neural Network (SNN) models within a unified ecosystem through both software-based simulation and FPGA-based emulation. RANC has been utilized by the community with its flexible and highly parameterized design to study implementation bottlenecks, tune architectural parameters or modify neuron behavior based on application insights and study the trade space on hardware performance and network accuracy. In designing architectures for use in neuromorphic computing, there are an incredibly large number of configuration parameters such as number and precision of weights per neuron, neuron and axon counts per core, network topology, and neuron behavior. To accelerate such studies and provide users with a streamlined productive design space exploration, in this paper we introduce the GPU-based implementation of RANC. We summarize our parallelization approach and quantify the speedup gains achieved with GPU-based tick-accurate simulations across various use cases. We demonstrate up to 780 times speedup compared to serial version of the RANC simulator based on a 512 neuromorphic core MNIST inference application. We believe that the RANC ecosystem now provides a much more feasible avenue in the research of exploring different optimizations for accelerating SNNs and performing richer studies by enabling rapid convergence to optimized neuromorphic architectures.
- Abstract(参考訳): オープンソースシミュレーションツールは、ニューロモルフィックなアプリケーションエンジニアやハードウェアアーキテクトにとって、パフォーマンスボトルネックを調査し、シリコンにコミットする前に設計最適化を検討する上で重要な役割を果たす。
Reconfigurable Architecture for Neuromorphic Computing (RANC)は、ソフトウェアベースのシミュレーションとFPGAベースのエミュレーションの両方を通じて、統合されたエコシステム内で事前訓練されたスパイキングニューラルネットワーク(SNN)モデルを実行する機能を提供するツールである。
RANCは、実装ボトルネックを調査し、アーキテクチャパラメータをチューニングしたり、アプリケーションの洞察に基づいてニューロンの振る舞いを変更し、ハードウェアの性能とネットワークの正確性に関する貿易空間を研究するために、柔軟でパラメータ化された設計でコミュニティによって利用されてきた。
ニューロモルフィックコンピューティングで使用するアーキテクチャの設計には、ニューロン当たりの重みの数と精度、コア当たりのニューロンと軸索の数、ネットワークトポロジ、ニューロンの振る舞いなど、信じられないほど多くの構成パラメータがある。
このような研究を加速し、ユーザに生産的な空間探索の合理化を提供するため、本稿では、RANCのGPUベースの実装を紹介する。
我々は並列化のアプローチを要約し、GPUベースの様々なユースケースにおけるTick-accurateシミュレーションで達成したスピードアップのゲインを定量化する。
512個のニューロモルフィックコアMNIST推論アプリケーションに基づくRANCシミュレータのシリアルバージョンと比較して,最大780倍の高速化を示した。
RANCエコシステムは、SNNを加速させ、最適化されたニューロモルフィックアーキテクチャに迅速に収束させることにより、よりリッチな研究を行うための様々な最適化を探索する研究において、より実現可能な手段を提供すると考えている。
関連論文リスト
- SpikingJelly: An open-source machine learning infrastructure platform
for spike-based intelligence [51.6943465041708]
スパイキングニューラルネットワーク(SNN)は、高エネルギー効率のニューロモルフィックチップに脳にインスパイアされたインテリジェンスを実現することを目的としている。
我々は、ニューロモルフィックデータセットの事前処理、深層SNNの構築、パラメータの最適化、およびニューロモルフィックチップへのSNNのデプロイのためのフルスタックツールキットをコントリビュートする。
論文 参考訳(メタデータ) (2023-10-25T13:15:17Z) - Intelligence Processing Units Accelerate Neuromorphic Learning [52.952192990802345]
スパイキングニューラルネットワーク(SNN)は、エネルギー消費と遅延の観点から、桁違いに改善されている。
我々は、カスタムSNN PythonパッケージsnnTorchのIPU最適化リリースを提示する。
論文 参考訳(メタデータ) (2022-11-19T15:44:08Z) - NAR-Former: Neural Architecture Representation Learning towards Holistic
Attributes Prediction [37.357949900603295]
本稿では,属性の全体的推定に使用できるニューラルネットワーク表現モデルを提案する。
実験の結果,提案するフレームワークは,セルアーキテクチャとディープニューラルネットワーク全体の遅延特性と精度特性を予測できることがわかった。
論文 参考訳(メタデータ) (2022-11-15T10:15:21Z) - Towards Theoretically Inspired Neural Initialization Optimization [66.04735385415427]
我々は,ニューラルネットワークの初期状態を評価するための理論的知見を備えた,GradCosineという微分可能な量を提案する。
標準制約下でGradCosineを最大化することにより、ネットワークのトレーニングとテストの両方の性能を向上させることができることを示す。
サンプル分析から実際のバッチ設定に一般化されたNIOは、無視可能なコストで、より優れた初期化を自動で探すことができる。
論文 参考訳(メタデータ) (2022-10-12T06:49:16Z) - MAPLE-X: Latency Prediction with Explicit Microprocessor Prior Knowledge [87.41163540910854]
ディープニューラルネットワーク(DNN)レイテンシのキャラクタリゼーションは、時間を要するプロセスである。
ハードウェアデバイスの事前知識とDNNアーキテクチャのレイテンシを具体化し,MAPLEを拡張したMAPLE-Xを提案する。
論文 参考訳(メタデータ) (2022-05-25T11:08:20Z) - Mapping and Validating a Point Neuron Model on Intel's Neuromorphic
Hardware Loihi [77.34726150561087]
インテルの第5世代ニューロモルフィックチップ「Loihi」の可能性について検討する。
Loihiは、脳内のニューロンをエミュレートするスパイキングニューラルネットワーク(SNN)という新しいアイデアに基づいている。
Loihiは従来のシミュレーションを非常に効率的に再現し、ネットワークが大きくなるにつれて、時間とエネルギーの両方のパフォーマンスにおいて顕著にスケールする。
論文 参考訳(メタデータ) (2021-09-22T16:52:51Z) - NeuroXplorer 1.0: An Extensible Framework for Architectural Exploration
with Spiking Neural Networks [3.9121275263540087]
本稿では、ニューロモルフィックアーキテクチャをモデル化するための一般化テンプレートに基づくフレームワークであるNeuroXplorerを提案する。
NeuroXplorerは、低レベルのサイクル精度アーキテクチャシミュレーションと、データフローの抽象化による高レベルの解析の両方を実行することができる。
我々は,多くの最先端機械学習モデルを用いたケーススタディを通じて,NeuroXplorerのアーキテクチャ探索能力を実証する。
論文 参考訳(メタデータ) (2021-05-04T23:31:11Z) - Differentiable Neural Architecture Learning for Efficient Neural Network
Design [31.23038136038325]
スケールド・シグモイド関数に基づく新しいemphアーキテクチャのパラメータ化を提案する。
そこで本論文では,候補ニューラルネットワークを評価することなく,ニューラルネットワークを最適化するための汎用的エファイブルニューラルネットワーク学習(DNAL)手法を提案する。
論文 参考訳(メタデータ) (2021-03-03T02:03:08Z) - RANC: Reconfigurable Architecture for Neuromorphic Computing [1.1534748916340396]
本稿では、ニューロモルフィックコンピューティングのための再構成可能なアーキテクチャRANCを提案する。
RANCはC++シミュレーションとFPGAエミュレーションによるハードウェアによるニューロモルフィックアーキテクチャの迅速な実験を可能にする。
我々は,IBMのTrueNorthの挙動を再現する能力を示すことで,RANCエコシステムの有用性を示す。
259Kの異なる神経細胞と73.3Mの異なるシナプスをエミュレートする神経型アーキテクチャを実証する。
論文 参考訳(メタデータ) (2020-11-01T20:29:52Z) - STONNE: A Detailed Architectural Simulator for Flexible Neural Network
Accelerators [5.326345912766044]
STONNEはサイクル精度が高く、高度にモジュール化され、高度に拡張可能なシミュレーションフレームワークである。
一般に公開されているBSV符号化MAERIの実装の性能結果にどのように近づくかを示す。
論文 参考訳(メタデータ) (2020-06-10T19:20:52Z) - A Semi-Supervised Assessor of Neural Architectures [157.76189339451565]
我々は、ニューラルネットワークの有意義な表現を見つけるためにオートエンコーダを用いる。
アーキテクチャの性能を予測するために、グラフ畳み込みニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-05-14T09:02:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。