論文の概要: GPU-RANC: A CUDA Accelerated Simulation Framework for Neuromorphic Architectures
- arxiv url: http://arxiv.org/abs/2404.16208v1
- Date: Wed, 24 Apr 2024 21:08:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-26 15:27:26.437160
- Title: GPU-RANC: A CUDA Accelerated Simulation Framework for Neuromorphic Architectures
- Title(参考訳): GPU-RANC:ニューロモルフィックアーキテクチャのためのCUDA加速シミュレーションフレームワーク
- Authors: Sahil Hassan, Michael Inouye, Miguel C. Gonzalez, Ilkin Aliyev, Joshua Mack, Maisha Hafiz, Ali Akoglu,
- Abstract要約: ニューロモーフィックコンピューティングのための再構成可能なアーキテクチャ(RANC)のGPUによる実装について紹介する。
512個のニューロモルフィックコアMNIST推論アプリケーションに基づくRANCシミュレータのシリアルバージョンと比較して,最大780倍の高速化を示した。
- 参考スコア(独自算出の注目度): 1.3401966602181168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-source simulation tools play a crucial role for neuromorphic application engineers and hardware architects to investigate performance bottlenecks and explore design optimizations before committing to silicon. Reconfigurable Architecture for Neuromorphic Computing (RANC) is one such tool that offers ability to execute pre-trained Spiking Neural Network (SNN) models within a unified ecosystem through both software-based simulation and FPGA-based emulation. RANC has been utilized by the community with its flexible and highly parameterized design to study implementation bottlenecks, tune architectural parameters or modify neuron behavior based on application insights and study the trade space on hardware performance and network accuracy. In designing architectures for use in neuromorphic computing, there are an incredibly large number of configuration parameters such as number and precision of weights per neuron, neuron and axon counts per core, network topology, and neuron behavior. To accelerate such studies and provide users with a streamlined productive design space exploration, in this paper we introduce the GPU-based implementation of RANC. We summarize our parallelization approach and quantify the speedup gains achieved with GPU-based tick-accurate simulations across various use cases. We demonstrate up to 780 times speedup compared to serial version of the RANC simulator based on a 512 neuromorphic core MNIST inference application. We believe that the RANC ecosystem now provides a much more feasible avenue in the research of exploring different optimizations for accelerating SNNs and performing richer studies by enabling rapid convergence to optimized neuromorphic architectures.
- Abstract(参考訳): オープンソースシミュレーションツールは、ニューロモルフィックなアプリケーションエンジニアやハードウェアアーキテクトにとって、パフォーマンスボトルネックを調査し、シリコンにコミットする前に設計最適化を検討する上で重要な役割を果たす。
Reconfigurable Architecture for Neuromorphic Computing (RANC)は、ソフトウェアベースのシミュレーションとFPGAベースのエミュレーションの両方を通じて、統合されたエコシステム内で事前訓練されたスパイキングニューラルネットワーク(SNN)モデルを実行する機能を提供するツールである。
RANCは、実装ボトルネックを調査し、アーキテクチャパラメータをチューニングしたり、アプリケーションの洞察に基づいてニューロンの振る舞いを変更し、ハードウェアの性能とネットワークの正確性に関する貿易空間を研究するために、柔軟でパラメータ化された設計でコミュニティによって利用されてきた。
ニューロモルフィックコンピューティングで使用するアーキテクチャの設計には、ニューロン当たりの重みの数と精度、コア当たりのニューロンと軸索の数、ネットワークトポロジ、ニューロンの振る舞いなど、信じられないほど多くの構成パラメータがある。
このような研究を加速し、ユーザに生産的な空間探索の合理化を提供するため、本稿では、RANCのGPUベースの実装を紹介する。
我々は並列化のアプローチを要約し、GPUベースの様々なユースケースにおけるTick-accurateシミュレーションで達成したスピードアップのゲインを定量化する。
512個のニューロモルフィックコアMNIST推論アプリケーションに基づくRANCシミュレータのシリアルバージョンと比較して,最大780倍の高速化を示した。
RANCエコシステムは、SNNを加速させ、最適化されたニューロモルフィックアーキテクチャに迅速に収束させることにより、よりリッチな研究を行うための様々な最適化を探索する研究において、より実現可能な手段を提供すると考えている。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - A Realistic Simulation Framework for Analog/Digital Neuromorphic Architectures [73.65190161312555]
ARCANAは、混合信号ニューロモルフィック回路の特性を考慮に入れたスパイクニューラルネットワークシミュレータである。
その結果,ソフトウェアでトレーニングしたスパイクニューラルネットワークの挙動を,信頼性の高い推定結果として提示した。
論文 参考訳(メタデータ) (2024-09-23T11:16:46Z) - Applying generative neural networks for fast simulations of the ALICE (CERN) experiment [0.0]
この論文は、CERNのゼロ・デグレ・カロリメータ(ZDC)中性子検出器の高速シミュレーションのための生成ニューラルネットワークへの最先端の応用について研究している。
GEANT Monte Carlo ツールキットを用いた従来のシミュレーション手法は正確ではあるが、計算的に要求される。
この論文は、コンピュータビジョンにおけるニューラルネットワークの適用、機械学習を用いた高速シミュレーション、高エネルギー物理学における生成ニューラルネットワークに関する包括的な文献レビューを提供する。
論文 参考訳(メタデータ) (2024-07-10T17:08:59Z) - Intelligence Processing Units Accelerate Neuromorphic Learning [52.952192990802345]
スパイキングニューラルネットワーク(SNN)は、エネルギー消費と遅延の観点から、桁違いに改善されている。
我々は、カスタムSNN PythonパッケージsnnTorchのIPU最適化リリースを提示する。
論文 参考訳(メタデータ) (2022-11-19T15:44:08Z) - MAPLE-X: Latency Prediction with Explicit Microprocessor Prior Knowledge [87.41163540910854]
ディープニューラルネットワーク(DNN)レイテンシのキャラクタリゼーションは、時間を要するプロセスである。
ハードウェアデバイスの事前知識とDNNアーキテクチャのレイテンシを具体化し,MAPLEを拡張したMAPLE-Xを提案する。
論文 参考訳(メタデータ) (2022-05-25T11:08:20Z) - Mapping and Validating a Point Neuron Model on Intel's Neuromorphic
Hardware Loihi [77.34726150561087]
インテルの第5世代ニューロモルフィックチップ「Loihi」の可能性について検討する。
Loihiは、脳内のニューロンをエミュレートするスパイキングニューラルネットワーク(SNN)という新しいアイデアに基づいている。
Loihiは従来のシミュレーションを非常に効率的に再現し、ネットワークが大きくなるにつれて、時間とエネルギーの両方のパフォーマンスにおいて顕著にスケールする。
論文 参考訳(メタデータ) (2021-09-22T16:52:51Z) - NeuroXplorer 1.0: An Extensible Framework for Architectural Exploration
with Spiking Neural Networks [3.9121275263540087]
本稿では、ニューロモルフィックアーキテクチャをモデル化するための一般化テンプレートに基づくフレームワークであるNeuroXplorerを提案する。
NeuroXplorerは、低レベルのサイクル精度アーキテクチャシミュレーションと、データフローの抽象化による高レベルの解析の両方を実行することができる。
我々は,多くの最先端機械学習モデルを用いたケーススタディを通じて,NeuroXplorerのアーキテクチャ探索能力を実証する。
論文 参考訳(メタデータ) (2021-05-04T23:31:11Z) - RANC: Reconfigurable Architecture for Neuromorphic Computing [1.1534748916340396]
本稿では、ニューロモルフィックコンピューティングのための再構成可能なアーキテクチャRANCを提案する。
RANCはC++シミュレーションとFPGAエミュレーションによるハードウェアによるニューロモルフィックアーキテクチャの迅速な実験を可能にする。
我々は,IBMのTrueNorthの挙動を再現する能力を示すことで,RANCエコシステムの有用性を示す。
259Kの異なる神経細胞と73.3Mの異なるシナプスをエミュレートする神経型アーキテクチャを実証する。
論文 参考訳(メタデータ) (2020-11-01T20:29:52Z) - STONNE: A Detailed Architectural Simulator for Flexible Neural Network
Accelerators [5.326345912766044]
STONNEはサイクル精度が高く、高度にモジュール化され、高度に拡張可能なシミュレーションフレームワークである。
一般に公開されているBSV符号化MAERIの実装の性能結果にどのように近づくかを示す。
論文 参考訳(メタデータ) (2020-06-10T19:20:52Z) - A Semi-Supervised Assessor of Neural Architectures [157.76189339451565]
我々は、ニューラルネットワークの有意義な表現を見つけるためにオートエンコーダを用いる。
アーキテクチャの性能を予測するために、グラフ畳み込みニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-05-14T09:02:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。