論文の概要: Human-Level Control through Directly-Trained Deep Spiking Q-Networks
- arxiv url: http://arxiv.org/abs/2201.07211v3
- Date: Tue, 11 Apr 2023 01:41:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 19:34:20.987651
- Title: Human-Level Control through Directly-Trained Deep Spiking Q-Networks
- Title(参考訳): 直接学習型深部スパイクQネットワークによるヒューマンレベル制御
- Authors: Guisong Liu, Wenjie Deng, Xiurui Xie, Li Huang, Huajin Tang
- Abstract要約: スパイキングニューラルネットワーク(SNN)は、その高エネルギー効率のため、ニューロモルフィックなハードウェアに大きな可能性を秘めている。
本稿では,Leakyインテグレート・アンド・ファイアニューロンとDeep Q-Networkに基づいて,直接学習した深部スパイキング強化学習アーキテクチャを提案する。
我々の研究は、直接学習されたSNNを用いて、複数のAtariゲームで最先端のパフォーマンスを達成する最初のものである。
- 参考スコア(独自算出の注目度): 16.268397551693862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the third-generation neural networks, Spiking Neural Networks (SNNs) have
great potential on neuromorphic hardware because of their high
energy-efficiency. However, Deep Spiking Reinforcement Learning (DSRL), i.e.,
the Reinforcement Learning (RL) based on SNNs, is still in its preliminary
stage due to the binary output and the non-differentiable property of the
spiking function. To address these issues, we propose a Deep Spiking Q-Network
(DSQN) in this paper. Specifically, we propose a directly-trained deep spiking
reinforcement learning architecture based on the Leaky Integrate-and-Fire (LIF)
neurons and Deep Q-Network (DQN). Then, we adapt a direct spiking learning
algorithm for the Deep Spiking Q-Network. We further demonstrate the advantages
of using LIF neurons in DSQN theoretically. Comprehensive experiments have been
conducted on 17 top-performing Atari games to compare our method with the
state-of-the-art conversion method. The experimental results demonstrate the
superiority of our method in terms of performance, stability, robustness and
energy-efficiency. To the best of our knowledge, our work is the first one to
achieve state-of-the-art performance on multiple Atari games with the
directly-trained SNN.
- Abstract(参考訳): 第3世代のニューラルネットワークとして、スパイキングニューラルネットワーク(SNN)は、その高エネルギー効率のため、ニューロモルフィックなハードウェアに大きな可能性を秘めている。
しかし,SNNに基づく強化学習(Reinforcement Learning, RL)である深スパイキング強化学習(Deep Spiking Reinforcement Learning, DSRL)は, 2次出力とスパイキング関数の非微分特性のため,まだ初期段階にある。
本稿では,これらの問題に対処するために,Deep Spiking Q-Network (DSQN)を提案する。
具体的には、Leaky Integrate-and-Fire(LIF)ニューロンとDeep Q-Network(DQN)に基づいて、直接学習した深部スパイキング強化学習アーキテクチャを提案する。
次に、Deep Spiking Q-Networkに対して直接スパイキング学習アルゴリズムを適用する。
さらに,理論上は LIF ニューロンを DSQN に使用することの利点を示す。
提案手法を最先端変換法と比較するため,17種類のアタリゲームにおいて総合的な実験を行った。
実験の結果, 性能, 安定性, 堅牢性, エネルギー効率の点で, 提案手法の優位性を示した。
我々の知る限り、我々の研究は、直接学習されたSNNで複数のAtariゲームで最先端のパフォーマンスを達成する最初のものである。
関連論文リスト
- Fully Spiking Actor Network with Intra-layer Connections for
Reinforcement Learning [51.386945803485084]
エージェントが制御する多次元決定論的ポリシーを学習する必要があるタスクに焦点をあてる。
既存のスパイクベースのRL法は、SNNの出力として発火率を取り、完全に接続された層を通して連続的なアクション空間(つまり決定論的なポリシー)を表すように変換する。
浮動小数点行列操作を伴わない完全にスパイクするアクターネットワークを開発するため,昆虫に見られる非スパイク介在ニューロンからインスピレーションを得た。
論文 参考訳(メタデータ) (2024-01-09T07:31:34Z) - SpikingJelly: An open-source machine learning infrastructure platform
for spike-based intelligence [51.6943465041708]
スパイキングニューラルネットワーク(SNN)は、高エネルギー効率のニューロモルフィックチップに脳にインスパイアされたインテリジェンスを実現することを目的としている。
我々は、ニューロモルフィックデータセットの事前処理、深層SNNの構築、パラメータの最適化、およびニューロモルフィックチップへのSNNのデプロイのためのフルスタックツールキットをコントリビュートする。
論文 参考訳(メタデータ) (2023-10-25T13:15:17Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Joint A-SNN: Joint Training of Artificial and Spiking Neural Networks
via Self-Distillation and Weight Factorization [12.1610509770913]
スパイクニューラルネットワーク(SNN)は、脳ニューロンのスパイク特性を模倣する。
我々は、ANNとSNNの合同トレーニングフレームワークを提案し、ANNはSNNの最適化をガイドできる。
我々の手法は、他の多くの最先端の訓練方法より一貫して優れています。
論文 参考訳(メタデータ) (2023-05-03T13:12:17Z) - SPIDE: A Purely Spike-based Method for Training Feedback Spiking Neural
Networks [56.35403810762512]
イベントベースの計算を伴うスパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェアにおけるエネルギー効率の高い応用のために、脳にインスパイアされたモデルを約束している。
本研究では,最近提案されたトレーニング手法を拡張した平衡状態(SPIDE)に対するスパイクに基づく暗黙差分法について検討した。
論文 参考訳(メタデータ) (2023-02-01T04:22:59Z) - Solving the Spike Feature Information Vanishing Problem in Spiking Deep
Q Network with Potential Based Normalization [7.796499799525251]
スパイキング深度Qネットワークを直接訓練するための電位ベース層正規化法(pbLN)を提案する。
実験により,最先端のANN-SNN変換法や他のSDQN手法と比較して,提案したpbLNが深Qネットワーク(PL-SDQN)をスパイクすることで,Atariゲームタスクの性能が向上した。
論文 参考訳(メタデータ) (2022-06-08T02:45:18Z) - Deep Reinforcement Learning with Spiking Q-learning [51.386945803485084]
スパイクニューラルネットワーク(SNN)は、少ないエネルギー消費で人工知能(AI)を実現することが期待されている。
SNNと深部強化学習(RL)を組み合わせることで、現実的な制御タスクに有望なエネルギー効率の方法を提供する。
論文 参考訳(メタデータ) (2022-01-21T16:42:11Z) - Keys to Accurate Feature Extraction Using Residual Spiking Neural
Networks [1.101002667958165]
スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)の代替として興味深いものになった
本稿では,現代のスパイク建築の鍵となる構成要素について述べる。
我々は、成功しているResNetアーキテクチャのスパイクバージョンを設計し、異なるコンポーネントとトレーニング戦略をテストする。
論文 参考訳(メタデータ) (2021-11-10T21:29:19Z) - Effective and Efficient Computation with Multiple-timescale Spiking
Recurrent Neural Networks [0.9790524827475205]
本稿では,新しいタイプの適応スパイクリカレントニューラルネットワーク(SRNN)が,最先端の性能を実現する方法を示す。
我々は、従来のRNNよりも難しいタスクにおいて、SRNNの100倍のエネルギー改善を計算します。
論文 参考訳(メタデータ) (2020-05-24T01:04:53Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。