論文の概要: S2Act: Simple Spiking Actor
- arxiv url: http://arxiv.org/abs/2603.15725v1
- Date: Mon, 16 Mar 2026 17:55:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:06.913346
- Title: S2Act: Simple Spiking Actor
- Title(参考訳): S2Act:単純なスパイクアクター
- Authors: Ugur Akcal, Seung Hyun Kim, Mikihisa Yuasa, Hamid Osooli, Jiarui Sun, Ribhav Sahu, Mattia Gazzola, Huy T. Tran, Girish Chowdhary,
- Abstract要約: スパイキングニューラルネットワーク(SNN)は、オンボードニューラルネットワークポリシのサイズとパフォーマンスが、電力と計算予算によって制約されるモバイルロボティクスにおいて魅力的なものだ。
人口符号化、報酬変調、ハイブリッドニューラルネットワーク(ANN)アーキテクチャといった既存のSNNアプローチは、有望な結果を示している。
本稿では,SNNを用いてRLポリシーを3段階に展開する計算軽量なフレームワークである単純なスパイクアクタ(SLIF2Act)を提案する。
- 参考スコア(独自算出の注目度): 15.041243498226022
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spiking neural networks (SNNs) and biologically-inspired learning mechanisms are attractive in mobile robotics, where the size and performance of onboard neural network policies are constrained by power and computational budgets. Existing SNN approaches, such as population coding, reward modulation, and hybrid artificial neural network (ANN)-SNN architectures, have shown promising results; however, they face challenges in complex, highly stochastic environments due to SNN sensitivity to hyperparameters and inconsistent gradient signals. To address these challenges, we propose simple spiking actor (S2Act), a computationally lightweight framework that deploys an RL policy using an SNN in three steps: (1) architect an actor-critic model based on an approximated network of rate-based spiking neurons, (2) train the network with gradients using compatible activation functions, and (3) transfer the trained weights into physical parameters of rate-based leaky integrate-and-fire (LIF) neurons for inference and deployment. By globally shaping LIF neuron parameters such that their rate-based responses approximate ReLU activations, S2Act effectively mitigates the vanishing gradient problem, while pre-constraining LIF response curves reduces reliance on complex SNN-specific hyperparameter tuning. We demonstrate our method in two multi-agent stochastic environments (capture-the-flag and parking) that capture the complexity of multi-robot interactions, and deploy our trained policies on physical TurtleBot platforms using Intel's Loihi neuromorphic hardware. Our experimental results show that S2Act outperforms relevant baselines in task performance and real-time inference in nearly all considered scenarios, highlighting its potential for rapid prototyping and efficient real-world deployment of SNN-based RL policies.
- Abstract(参考訳): スパイキングニューラルネットワーク(SNN)と生物学的にインスパイアされた学習メカニズムは、搭載されたニューラルネットワークポリシーのサイズと性能が電力と計算予算によって制約されるモバイルロボティクスにおいて魅力的である。
人口符号化、報酬変調、ハイブリッドニューラルネットワーク(ANN)-SNNアーキテクチャといった既存のSNNアプローチは、有望な結果を示しているが、SNNのハイパーパラメータや一貫性のない勾配信号に対する感度のため、複雑で確率的な環境では課題に直面している。
これらの課題に対処するために、SNNを用いてRLポリシーをデプロイする計算軽量なフレームワークである単純なスパイクアクター(S2Act)を提案する。(1)レートベーススパイクニューロンの近似ネットワークに基づいてアクター批判モデルを設計し、(2)互換性のあるアクティベーション関数を用いて勾配でネットワークを訓練し、(3)トレーニングされた重量をレートベースインテリジェンス・アンド・ファイア(LIF)ニューロンの物理パラメータに転送し、推論と展開を行う。
S2Act は LIF ニューロンパラメータを世界規模で形成することにより、ReLU のアクティベーションに近似したレートベースの応答により、消滅する勾配問題を効果的に軽減し、一方、LIF 応答曲線の事前制約は、複雑な SNN 固有のハイパーパラメータチューニングへの依存を減らす。
我々は,マルチロボットインタラクションの複雑さを捉えた2つのマルチエージェント確率環境(キャプチャー・ザ・フラッグ・アンド・パーキング)において本手法を実証し,IntelのLoihiニューロモルフィックハードウェアを用いて,物理的なTurtleBotプラットフォームにトレーニングされたポリシーをデプロイする。
実験の結果、S2Actはタスク性能とリアルタイム推論において、ほぼすべてのシナリオにおいて、関連するベースラインよりも優れており、SNNベースのRLポリシーの迅速なプロトタイピングと効率的な実環境展開の可能性を強調している。
関連論文リスト
- PTS-SNN: A Prompt-Tuned Temporal Shift Spiking Neural Networks for Efficient Speech Emotion Recognition [12.087823767638788]
音声感情認識(SER)は人間とコンピュータのインタラクションに広く利用されているが、高い計算コストはリソースに制約のあるエッジデバイスの実装を妨げる。
本稿では, スパイキングダイナミクスを用いたパラメータ効率のよいニューロモルフィック適応である, Prompt-Tuned Spiking Neural Networks (PTS-SNN) を提案する。
論文 参考訳(メタデータ) (2026-02-09T03:29:16Z) - Parameter efficient hybrid spiking-quantum convolutional neural network with surrogate gradient and quantum data-reupload [0.20999222360659606]
Spiking Quantum Neural Network(SQNN)は、スパイクニューラルネットワーク(SNN)と量子コンピューティングの原則を組み合わせたものだ。
SQDR-CNNは、単一のバックプロパゲーションフレームワーク内で畳み込みSNNと量子回路の共同トレーニングを可能にする。
我々は,SOTA SNNベースラインの平均最高性能精度の86%を達成しているが,最小スパイキングモデルのパラメータの0.5%しか使用していない。
論文 参考訳(メタデータ) (2025-12-03T15:43:33Z) - Deep-Unrolling Multidimensional Harmonic Retrieval Algorithms on Neuromorphic Hardware [78.17783007774295]
本稿では,高精度かつエネルギー効率の高い単発多次元高調波検索のための変換に基づくニューロモルフィックアルゴリズムの可能性について検討する。
複雑な値の畳み込み層と活性化をスパイクニューラルネットワーク(SNN)に変換する新しい手法を開発した。
変換されたSNNは、元のCNNに比べて性能が低下し、ほぼ5倍の電力効率を実現している。
論文 参考訳(メタデータ) (2024-12-05T09:41:33Z) - Synchronized Stepwise Control of Firing and Learning Thresholds in a Spiking Randomly Connected Neural Network toward Hardware Implementation [0.0]
固有可塑性(IP)とシナプス可塑性(SP)のハードウェア指向モデルを提案する。
心電図を用いたスパイキングRNNによる時間的データ学習と異常検出のシミュレーションにより,本モデルの有効性を実証する。
論文 参考訳(メタデータ) (2024-04-26T08:26:10Z) - Fully Spiking Actor Network with Intra-layer Connections for
Reinforcement Learning [51.386945803485084]
エージェントが制御する多次元決定論的ポリシーを学習する必要があるタスクに焦点をあてる。
既存のスパイクベースのRL法は、SNNの出力として発火率を取り、完全に接続された層を通して連続的なアクション空間(つまり決定論的なポリシー)を表すように変換する。
浮動小数点行列操作を伴わない完全にスパイクするアクターネットワークを開発するため,昆虫に見られる非スパイク介在ニューロンからインスピレーションを得た。
論文 参考訳(メタデータ) (2024-01-09T07:31:34Z) - Evolving Connectivity for Recurrent Spiking Neural Networks [8.80300633999542]
リカレントニューラルネットワーク(RSNN)は、人工知能の進歩に大きな可能性を秘めている。
本稿では、RSNNをトレーニングするための推論のみの手法である、進化的接続性(EC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-28T07:08:25Z) - A Hybrid Neural Coding Approach for Pattern Recognition with Spiking
Neural Networks [53.31941519245432]
脳にインスパイアされたスパイクニューラルネットワーク(SNN)は、パターン認識タスクを解く上で有望な能力を示している。
これらのSNNは、情報表現に一様神経コーディングを利用する同質ニューロンに基づいている。
本研究では、SNNアーキテクチャは異種符号化方式を組み込むよう、均質に設計されるべきである、と論じる。
論文 参考訳(メタデータ) (2023-05-26T02:52:12Z) - Training High-Performance Low-Latency Spiking Neural Networks by
Differentiation on Spike Representation [70.75043144299168]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上に実装された場合、有望なエネルギー効率のAIモデルである。
非分化性のため、SNNを効率的に訓練することは困難である。
本稿では,ハイパフォーマンスを実現するスパイク表現法(DSR)の差分法を提案する。
論文 参考訳(メタデータ) (2022-05-01T12:44:49Z) - Skip-Connected Self-Recurrent Spiking Neural Networks with Joint
Intrinsic Parameter and Synaptic Weight Training [14.992756670960008]
我々はSkip-Connected Self-Recurrent SNNs (ScSr-SNNs) と呼ばれる新しいタイプのRSNNを提案する。
ScSr-SNNは、最先端BP法で訓練された他のタイプのRSNNと比較して、パフォーマンスを最大2.55%向上させることができる。
論文 参考訳(メタデータ) (2020-10-23T22:27:13Z) - Progressive Tandem Learning for Pattern Recognition with Deep Spiking
Neural Networks [80.15411508088522]
スパイキングニューラルネットワーク(SNN)は、低レイテンシと高い計算効率のために、従来の人工知能ニューラルネットワーク(ANN)よりも優位性を示している。
高速かつ効率的なパターン認識のための新しいANN-to-SNN変換およびレイヤワイズ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-02T15:38:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。