論文の概要: UniSpike: Accelerating Spiking Neural Networks on Neuromorphic Systems via Eliminating Address Redundancy
- arxiv url: http://arxiv.org/abs/2605.23796v1
- Date: Fri, 22 May 2026 15:57:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.423898
- Title: UniSpike: Accelerating Spiking Neural Networks on Neuromorphic Systems via Eliminating Address Redundancy
- Title(参考訳): UniSpike: アドレス冗長性の排除によるニューロモルフィックシステム上でのスパイクニューラルネットワークの高速化
- Authors: Qinghui Xing, Zhuo Chen, Xin Du, Ouwen Jin, Ming Zhang, Pan Lv, Ying Li, Shuiguang Deng, Gang Pan,
- Abstract要約: UniSpike(ユニスパイク)は、ハードウェアとソフトウェアの共同設計で、同じコアが持つスパイクをコンパクトなパケットに集約することでアドレス冗長性を除去する。
多様なSNNワークロード全体で、UniSpikeはトラフィックを平均1.93$times$、スピードアップ1.77$times$、エネルギー効率の改善1.50$times$で削減する。
- 参考スコア(独自算出の注目度): 32.99483606573671
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many-core neuromorphic systems accelerate Spiking Neural Networks (SNNs), yet their packet-based spike communication can spend substantial traffic and energy repeatedly transmitting destination addresses. This overhead is amplified by the small payload of spike packets: in representative workloads, duplicate address transmissions account for up to 49% of the total traffic. This paper presents UniSpike, a hardware-software co-design that removes address redundancy by aggregating spikes destined for the same core into compact packets. UniSpike combines destination-centric spike scheduling, lightweight runtime packet assembly hardware, and destination-aware SNN partitioning. Across diverse SNN workloads, UniSpike reduces traffic by 1.93$\times$ on average, delivering 1.77$\times$ speedup and 1.50$\times$ energy efficiency improvement over state-of-the-art designs.
- Abstract(参考訳): 多くのコアニューロモルフィックシステムはスパイキングニューラルネットワーク(SNN)を加速するが、パケットベースのスパイク通信は、宛先アドレスを繰り返し送信するトラフィックとエネルギーをかなり消費することができる。
このオーバーヘッドは、スパイクパケットの小さなペイロードによって増幅される。代表的ワークロードでは、重複アドレス送信が全トラフィックの最大49%を占める。
本稿では,ハードウェア・ソフトウェアの共同設計であるUniSpikeについて,同一コアに宿るスパイクをコンパクトパケットに集約することでアドレス冗長性を除去する手法を提案する。
UniSpikeは、宛先中心のスパイクスケジューリング、軽量ランタイムパケットアセンブリハードウェア、宛先対応SNNパーティショニングを組み合わせる。
様々なSNNワークロード全体で、UniSpikeはトラフィックを平均1.93$\times$に減らし、1.77$\times$スピードアップと1.50$\times$エネルギー効率の改善を提供する。
関連論文リスト
- Time Is All It Takes: Spike-Retiming Attacks on Event-Driven Spiking Neural Networks [87.16809558673403]
スパイキングニューラルネットワーク(SNN)は離散スパイクで計算し、時間構造を利用する。
イベント駆動SNNにおけるスパイク数と振幅を保存しながら、既存のスパイクを繰り返すタイミングのみの敵について検討する。
論文 参考訳(メタデータ) (2026-02-03T09:06:53Z) - Distributed Link Sparsification for Scalable Scheduling Using Graph Neural Networks (Journal Version) [50.894272363373126]
密接な接続を特徴とする無線ネットワークでは、分散リンクスケジューリングアルゴリズムによって発生する重要な信号のオーバーヘッドは、混雑、エネルギー消費、無線フットプリント拡張といった問題を悪化させる可能性がある。
ネットワーク容量を維持しながら遅延耐性トラフィックのスケジューリングオーバーヘッドを低減するために,グラフニューラルネットワーク(GNN)を用いた分散リンクスカラー化方式を提案する。
GNNモジュールは、トラフィック統計とネットワークトポロジに基づいて、個々のリンクに対する競合しきい値を調整するように訓練されており、成功しそうもない場合には、リンクがスケジュール競合から撤退することを可能にする。
論文 参考訳(メタデータ) (2025-09-05T18:59:14Z) - $SpikePack$: Enhanced Information Flow in Spiking Neural Networks with High Hardware Compatibility [6.569750512966661]
スパイキングニューラルネットワーク(SNN)は、エネルギー効率が高く生物学的にインスパイアされたコンピューティングを約束する。
我々は,膜電位リセットや漏洩結合といった重要な機能を保ちながら,透過損失を低減するために設計されたニューロンモデルである$SpikePack$を紹介した。
論文 参考訳(メタデータ) (2025-01-24T13:37:26Z) - Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングは、スパイキングニューラルネットワーク(SNN)を使用して推論タスクを実行する。
スパイクニューロン間で交換される各スパイクに小さなペイロードを埋め込むことで、エネルギー消費を増大させることなく推論精度を高めることができる。
分割コンピューティング — SNNを2つのデバイスに分割する — は、有望なソリューションだ。
本稿では,マルチレベルSNNを用いたニューロモルフィック無線分割コンピューティングアーキテクチャの総合的研究について述べる。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - LoAS: Fully Temporal-Parallel Dataflow for Dual-Sparse Spiking Neural Networks [14.844751188874652]
スパイキングニューラルネットワーク(SNN)は、リソースに制約のあるエッジデバイスを駆動する可能性から、過去10年間で大きな研究注目を集めている。
既存のSNNアクセラレーターはスパーススパイクを高密度で処理するが、スパースウェイトを持つSNNでは機会を探索することができない。
二重スパースSNNの加速について検討し、そのコア演算、スパース行列-スパース-マトリクス乗算(spMspM)に着目した。
論文 参考訳(メタデータ) (2024-07-19T07:02:26Z) - RAMP: A Flat Nanosecond Optical Network and MPI Operations for
Distributed Deep Learning Systems [68.8204255655161]
我々は、RAMPと呼ばれるナノ秒再構成による、ほぼスケール、全2分割帯域、オールツーオール、シングルホップ、オール光学ネットワークアーキテクチャを導入する。
RAMPは、最大65,536ノードで1ノードあたり12.8Tbpsの大規模分散並列コンピューティングシステムをサポートしている。
論文 参考訳(メタデータ) (2022-11-28T11:24:51Z) - Data Streaming and Traffic Gathering in Mesh-based NoC for Deep Neural
Network Acceleration [7.455546102930911]
本稿では,1対多のトラフィックを高速化するために,一方/双方向のストリーミングバスを備えたメッシュアーキテクチャを提案する。
畳み込みレイヤのランタイムレイテンシの解析は、双方向ストリーミングアーキテクチャが一方的なストリーミングアーキテクチャよりも改善されていることを示している。
論文 参考訳(メタデータ) (2021-08-01T23:50:12Z) - Improving the Performance of a NoC-based CNN Accelerator with Gather
Support [6.824747267214373]
ディープラーニング技術は、CNNのための効率的な並列コンピューティングアーキテクチャの必要性を促進する。
CNNのワークロードには1対1のトラフィックと1対1のトラフィックに加えて、多対1のトラフィックが導入されている。
本稿では,メッシュベースのNoCにおいて,複数対1のトラフィックをサポートするために,出力定常シストリックアレイを用いて収集パケットを利用することを提案する。
論文 参考訳(メタデータ) (2021-08-01T23:33:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。