論文の概要: ELSA: An ELastic SNN Inference Architecture for Efficient Neuromorphic Computing
- arxiv url: http://arxiv.org/abs/2605.20802v1
- Date: Wed, 20 May 2026 06:47:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.537134
- Title: ELSA: An ELastic SNN Inference Architecture for Efficient Neuromorphic Computing
- Title(参考訳): ELSA: 効率的なニューロモルフィックコンピューティングのためのELastic SNN推論アーキテクチャ
- Authors: Kang You, Chen Nie, Lee Jun Yan, Ziling Wei, Cheng Zou, Zekai Xu, Yu Feng, Honglan Jiang, Zhezhi He,
- Abstract要約: スパイキングニューラルネットワーク(SNN)は、イベント駆動型および加算専用計算を利用する。
既存のSNN固有の加速器は、弾性推論に乗じることができない。
我々は,真の弾性推論を実現する,ほぼSRAMデータフローアーキテクチャであるELSAを提案する。
- 参考スコア(独自算出の注目度): 15.046996493033731
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Spiking neural networks (SNNs) exploit event-driven and addition-only computation to substantially improve efficiency for intelligent computation. A key temporal property of SNNs, elastic inference, allows outputs to emerge progressively, enabling responses to salient inputs much earlier than full evaluation. However, existing SNN-specific accelerators cannot capitalize on this property. Layer-by-layer designs emit outputs only after all layers are complete, while time-step-by-time-step designs rely on coarse-grained, layer-wise pipelines that require synchronizing all spines/tokens within a layer. This barrier prevents results from being forwarded immediately, delaying the earliest possible response and forfeiting the benefits of elastic inference. To address these challenges, we propose ELSA, a near-SRAM dataflow architecture that realizes true elastic inference through a fine-grained spine/token-wise pipeline and hardware optimizations tailored to SNNs. ELSA forwards each spine/token immediately upon production, forming a continuous streaming pipeline that substantially reduces the latency to the first response. To enhance this lightweight execution, ELSA introduces a bundled address event representation protocol to lower communication traffic of network-on-chip (NoC), and leverages mini-batch spiking Gustavson-product to cut memory access and exploit inherent sparsity. Combined with mapping and scheduling optimizations, ELSA achieves efficient, event-driven computation without compromising accuracy. Experiments show that SNNs can outperform quantized artificial neural networks (QANNs) while maintaining on-par accuracy. For a 4-bit ResNet-50, ELSA achieves 3.4$\times$ speedup and 13.6$\times$ higher energy efficiency over the SOTA QANN accelerator (ANT), and 2.9$\times$ speedup and 22.1$\times$ energy efficiency gains over the SOTA SNN accelerator (PAICORE).
- Abstract(参考訳): スパイクニューラルネットワーク(SNN)は、イベント駆動および追加のみの計算を利用して、インテリジェントな計算の効率を大幅に改善する。
SNNの重要な時間的特性、すなわち弾性推論は出力を段階的に発生させ、完全な評価よりもはるかに早く入力に対する応答を可能にする。
しかし、既存のSNN固有のアクセラレーターは、この特性を利用することはできない。
レイヤ・バイ・レイヤの設計はすべてのレイヤが完成した後にのみ出力を出力するが、タイム・バイ・タイム・ステップの設計は、階層内のすべてのスピン/トークンの同期を必要とする、粗い粒度の層回りのパイプラインに依存している。
この障壁は、結果がすぐに転送されることを防ぎ、最初期の応答を遅らせ、弾性推論の利点を失わせる。
これらの課題に対処するため, ELSAを提案する。これは, SNNに最適化された細粒度スピン/トケンワイズパイプラインとハードウェア最適化により, 真の弾性推論を実現する, 近SRAMデータフローアーキテクチャである。
ELSAは運用直後に各スピンを転送し、最初のレスポンスのレイテンシを大幅に削減する継続的ストリーミングパイプラインを形成する。
この軽量な実行を強化するため、ELSAはネットワークオンチップ(NoC)の通信トラフィックを減らすためにバンドルアドレスイベント表現プロトコルを導入し、メモリアクセスを削減し、固有の疎結合を利用するために、ミニバッチスパイクのGustavson-productを活用する。
マッピングとスケジューリングの最適化を組み合わせることで、ELSAは精度を損なうことなく、効率的なイベント駆動計算を実現する。
実験により、SNNは量子化された人工知能ニューラルネットワーク(QANN)よりも高い精度を維持しながら性能を発揮することが示された。
4ビットのResNet-50では、ELSAはSOTA QANN加速器(ANT)よりも3.4$\times$のエネルギー効率と13.6$のエネルギー効率、2.9$\times$のスピードアップ、22.1$のエネルギー効率がSOTA SNN加速器(PAICORE)より向上する。
関連論文リスト
- S$^2$NN: Sub-bit Spiking Neural Networks [53.08060832135342]
スパイキングニューラルネットワーク(SNN)は、マシンインテリジェンスにエネルギー効率のよいパラダイムを提供する。
最近のバイナリSNNの進歩にもかかわらず、大規模ネットワークではストレージと計算の要求が相当に大きい。
1ビット未満の重みを表すサブビットスパイキングニューラルネットワーク(S$2$NNs)を提案する。
論文 参考訳(メタデータ) (2025-09-29T04:17:44Z) - SpikeX: Exploring Accelerator Architecture and Network-Hardware Co-Optimization for Sparse Spiking Neural Networks [3.758294848902233]
本研究では,非構造的空間性から生じる課題と機会に対処するため,Systolic-array SNNアクセラレーターアーキテクチャであるSpikeXを提案する。
SpikeXはメモリアクセスを減らし、データ共有と時間と空間にまたがる計算を対象とするハードウェア利用を増加させる。
論文 参考訳(メタデータ) (2025-05-18T08:07:44Z) - Lightweight LIF-only SNN accelerator using differential time encoding [0.3749861135832073]
スパイキングニューラルネットワーク(SNN)は、現代の機械学習(ML)アプリケーションにおいて、計算とエネルギーの要求を増大させる問題に対して、有望な解決策を提供する。
スパイクとスパイクトレインを使用する独自のデータ表現の選択のため、彼らは主に、最先端(SOTA)人工ニューラルネットワーク(ANN)に近づく結果を達成するために追加としきい値操作に依存している。
この研究は、LIFのみのSNNをフィードフォワードで計算できるハードウェアアクセラレーターアーキテクチャと、既存のデータをスパイクトレインに効率的にエンコードするための符号化手法を導入する。
論文 参考訳(メタデータ) (2025-05-16T13:42:39Z) - $SpikePack$: Enhanced Information Flow in Spiking Neural Networks with High Hardware Compatibility [6.569750512966661]
スパイキングニューラルネットワーク(SNN)は、エネルギー効率が高く生物学的にインスパイアされたコンピューティングを約束する。
我々は,膜電位リセットや漏洩結合といった重要な機能を保ちながら,透過損失を低減するために設計されたニューロンモデルである$SpikePack$を紹介した。
論文 参考訳(メタデータ) (2025-01-24T13:37:26Z) - Intelligence Processing Units Accelerate Neuromorphic Learning [52.952192990802345]
スパイキングニューラルネットワーク(SNN)は、エネルギー消費と遅延の観点から、桁違いに改善されている。
我々は、カスタムSNN PythonパッケージsnnTorchのIPU最適化リリースを提示する。
論文 参考訳(メタデータ) (2022-11-19T15:44:08Z) - Training High-Performance Low-Latency Spiking Neural Networks by
Differentiation on Spike Representation [70.75043144299168]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上に実装された場合、有望なエネルギー効率のAIモデルである。
非分化性のため、SNNを効率的に訓練することは困難である。
本稿では,ハイパフォーマンスを実現するスパイク表現法(DSR)の差分法を提案する。
論文 参考訳(メタデータ) (2022-05-01T12:44:49Z) - Training Energy-Efficient Deep Spiking Neural Networks with Single-Spike
Hybrid Input Encoding [5.725845886457027]
スパイキングニューラルネットワーク(SNN)は、イベント駆動型ニューロモルフィックハードウェアにおいて高い計算効率を提供する。
SNNは、非効率な入力符号化とトレーニング技術により、高い推論遅延に悩まされる。
本稿では低遅延エネルギー効率SNNのためのトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-26T06:16:40Z) - Learning N:M Fine-grained Structured Sparse Neural Networks From Scratch [75.69506249886622]
ディープニューラルネットワーク(DNN)におけるスパーシティは、資源制約された環境でモデルを圧縮し、加速するために広く研究されている。
本稿では,N:M細粒構造スパースネットワークのスクラッチからトレーニングを初めて行う。
論文 参考訳(メタデータ) (2021-02-08T05:55:47Z) - You Only Spike Once: Improving Energy-Efficient Neuromorphic Inference
to ANN-Level Accuracy [51.861168222799186]
スパイキングニューラルネットワーク(英: Spiking Neural Networks、SNN)は、神経型ネットワークの一種である。
SNNはスパースであり、重量はごくわずかであり、通常、より電力集約的な乗算および累積演算の代わりに追加操作のみを使用する。
本研究では,TTFS符号化ニューロモルフィックシステムの限界を克服することを目的としている。
論文 参考訳(メタデータ) (2020-06-03T15:55:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。