論文の概要: When Spike Sparsity Does Not Translate to Deployed Cost: VS-WNO on Jetson Orin Nano
- arxiv url: http://arxiv.org/abs/2604.17040v1
- Date: Sat, 18 Apr 2026 15:52:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.302284
- Title: When Spike Sparsity Does Not Translate to Deployed Cost: VS-WNO on Jetson Orin Nano
- Title(参考訳): スパイクスペシャリティがデプロイコストに変換されない場合:VS-WNO on Jetson Orin Nano
- Authors: Jason Yoo, Shailesh Garg, Souvik Chakraborty, Syed Bahauddin Alam,
- Abstract要約: イベント駆動の基質はスパース活性を低いレイテンシとエネルギーに変換することができるため、スパイキングオペレーターはニューロエッジコンピューティングをアピールしている。
本研究では,5つの事前訓練された可変ウェーブレット・ニューラル・オペレータ(VS-WNO)チェックポイントと5つの一致した高密度ウェーブレット・ニューラル・オペレータ(WNO)チェックポイントを用いて,Jetson Orin Nano 8 GBについて検討する。
- 参考スコア(独自算出の注目度): 3.26654570054705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spiking neural operators are appealing for neuromorphic edge computing because event-driven substrates can, in principle, translate sparse activity into lower latency and energy. Whether that advantage survives deployment on commodity edge-GPU software stacks, however, remains unclear. We study this question on a Jetson Orin Nano 8 GB using five pretrained variable-spiking wavelet neural operator (VS-WNO) checkpoints and five matched dense wavelet neural operator (WNO) checkpoints on the Darcy rectangular benchmark. On a reference-aligned path, VS-WNO exhibits substantial algorithmic sparsity, with mean spike rates decreasing from 54.26% at the first spiking layer to 18.15% at the fourth. On a deployment-style request path, however, this sparsity does not reduce deployed cost: VS-WNO reaches 59.6 ms latency and 228.0 mJ dynamic energy per inference, whereas dense WNO reaches 53.2 ms and 180.7 mJ, while also achieving slightly lower reference-path error (1.77% versus 1.81%). Nsight Systems indicates that the request path remains launch-dominated and dense rather than sparsity-aware: for VS-WNO, cudaLaunchKernel accounts for 81.6% of CUDA API time within the latency window, and dense convolution kernels account for 53.8% of GPU kernel time; dense WNO shows the same pattern. On this Jetson-class GPU stack, spike sparsity is measurable but does not reduce deployed cost because the runtime does not suppress dense work as spike activity decreases.
- Abstract(参考訳): イベント駆動の基質は、原則としてスパース活性を低レイテンシとエネルギーに変換することができるため、スパイクニューラル演算子はニューロモルフィックエッジコンピューティングに訴えている。
しかし、それがコモディティエッジGPUソフトウェアスタックへのデプロイを継続するかどうかは不明だ。
本稿では,Jetson Orin Nano 8 GB において,Darcy 長方形ベンチマークにおいて,事前訓練された5つの可変スパイクウェーブレットニューラル演算子 (VS-WNO) チェックポイントと5つの一致した高密度ウェーブレットニューラル演算子 (WNO) チェックポイントを用いて検討した。
参照整列パスでは、VS-WNOはアルゴリズム的な空間性を示し、平均スパイクレートは第1のスパイク層では54.26%から第4のスパイク層では18.15%に低下した。
VS-WNOは59.6msのレイテンシと228.0mJのダイナミックエネルギーに到達し、一方密度の高いWNOは53.2msと180.7mJに到達し、参照パスエラーはわずかに低い(1.77%対1.81%)。
VS-WNOの場合、cudaLaunchKernelはレイテンシウィンドウ内のCUDA API時間の81.6%を占め、密度の高い畳み込みカーネルはGPUカーネル時間の53.8%を占め、密度の高いWNOは同じパターンを示している。
このJetsonクラスのGPUスタックでは、スパイク間隔は測定可能であるが、スパイクアクティビティが減少するにつれて、ランタイムが密な作業を抑制しないため、デプロイコストを削減できない。
関連論文リスト
- Sharpness-Aware Surrogate Training for On-Sensor Spiking Neural Networks [0.0]
シュロゲートフォワードSNNにシャープネス対応シャープネス認識(SAST)を導入し,トレーニング対象がスムーズで勾配が正確であることを示す。
2つのイベントカメラベンチマークでは、スワップのみのハードスパイク精度が、N-MNISTでは65.7%から94.7%に改善され、DVS Gestureでは31.8%から63.3%に改善された。
これらの結果は、SASTがテスト設定下でのオンセンサースパイク推論のためのより広範なツールボックスの有望なコンポーネントであることを示唆している。
論文 参考訳(メタデータ) (2026-04-06T23:32:17Z) - L-SPINE: A Low-Precision SIMD Spiking Neural Compute Engine for Resource-efficient Edge Inference [0.0]
L-SPINEは、効率的なエッジ推論のための低精度SIMD対応スパイクニューラルネットワークエンジンである。
このアーキテクチャは、2ビット、4ビット、8ビット操作をサポートする統合されたマルチ精度データパスを備えている。
L-SPINEは46.37K LUTs、30.4K FFs、2.38msのレイテンシ、0.54Wの電力を実現している。
論文 参考訳(メタデータ) (2026-04-04T07:46:16Z) - GLANCE: Gaze-Led Attention Network for Compressed Edge-inference [10.229095428511654]
AR/VRシステムにおけるリアルタイムオブジェクト検出は、厳格な電力予算内で10ms未満のレイテンシを必要とする、計算上の重要な制約に直面している。
生体の葉の視覚にインスパイアされた2段階のパイプラインを提案する。このパイプラインは、異なる重みのないニューラルネットワークを組み合わせ、超効率的な視線推定と、注意誘導された関心の領域検出を行う。
論文 参考訳(メタデータ) (2026-03-16T15:52:52Z) - High-throughput Visual Nano-drone to Nano-drone Relative Localization using Onboard Fully Convolutional Networks [51.23613834703353]
相対的なドローンとドローンのローカライゼーションは、どんなSwarm操作でも基本的なビルディングブロックである。
我々は、新しいビジョンベース完全畳み込みニューラルネットワーク(FCNN)に基づく垂直統合システムを提案する。
その結果,水平画像座標で32~47%,垂直画像座標で18~55%,実世界の30k画像のデータセットでR2乗改善が得られた。
論文 参考訳(メタデータ) (2024-02-21T12:34:31Z) - Spiker+: a framework for the generation of efficient Spiking Neural
Networks FPGA accelerators for inference at the edge [49.42371633618761]
Spiker+はFPGA上で、エッジでの推論のために効率よく、低消費電力で、低領域でカスタマイズされたSpking Neural Networks(SNN)アクセラレータを生成するためのフレームワークである。
Spiker+ は MNIST と Spiking Heidelberg Digits (SHD) の2つのベンチマークデータセットでテストされている。
論文 参考訳(メタデータ) (2024-01-02T10:42:42Z) - Ultra-low Power Deep Learning-based Monocular Relative Localization
Onboard Nano-quadrotors [64.68349896377629]
この研究は、2つのピアナノドロンのディープニューラルネットワーク(DNN)を介して、単分子の相対的な局所化に対処する、新しい自律的なエンドツーエンドシステムを示す。
超制約ナノドローンプラットフォームに対処するため,データセットの増大,量子化,システム最適化などを含む垂直統合フレームワークを提案する。
実験の結果,DNNは低分解能モノクローム画像のみを用いて最大2mの距離で10cmのターゲットナノドローンを正確に局在させることができることがわかった。
論文 参考訳(メタデータ) (2023-03-03T14:14:08Z) - LL-GNN: Low Latency Graph Neural Networks on FPGAs for High Energy
Physics [45.666822327616046]
本研究は,粒子検出器のための低グラフニューラルネットワーク(LL-GNN)設計のための新しい再構成可能なアーキテクチャを提案する。
LL-GNNの設計は、洗練されたアルゴリズムが実験データを効率的に処理できるようにすることで、次世代のトリガーシステムを進化させる。
論文 参考訳(メタデータ) (2022-09-28T12:55:35Z) - BottleFit: Learning Compressed Representations in Deep Neural Networks
for Effective and Efficient Split Computing [48.11023234245863]
圧縮速度が強い場合でも高い精度を達成するための新しいトレーニング戦略を含む,BottleFitと呼ばれる新しいフレームワークを提案する。
BottleFitは77.1%のデータ圧縮を実現し、ImageNetデータセットでは最大で0.6%の精度でロスする。
本稿では,BottleFitが消費電力とレイテンシを最大で49%,(w.r.t.)ローカルコンピューティングでは89%,エッジオフロードでは37%,W.r.t.エッジオフロードでは55%削減することを示した。
論文 参考訳(メタデータ) (2022-01-07T22:08:07Z) - Toward Compact Deep Neural Networks via Energy-Aware Pruning [2.578242050187029]
ネットワークにおける各フィルタの重要性を核ノルム(NN)を用いて定量化する新しいエネルギー対応プルーニング手法を提案する。
FLOPの40.4/49.8%、パラメータ還元の45.9/52.9%、トップ1の精度の94.13/94.61%、CIFAR-10のResNet-56/110で競合する結果を得た。
論文 参考訳(メタデータ) (2021-03-19T15:33:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。