Fugu-MT 論文翻訳(概要): Human-Level Control through Directly-Trained Deep Spiking Q-Networks

論文の概要: Human-Level Control through Directly-Trained Deep Spiking Q-Networks

arxiv url: http://arxiv.org/abs/2201.07211v3
Date: Tue, 11 Apr 2023 01:41:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-12 19:34:20.987651
Title: Human-Level Control through Directly-Trained Deep Spiking Q-Networks
Title（参考訳）: 直接学習型深部スパイクQネットワークによるヒューマンレベル制御
Authors: Guisong Liu, Wenjie Deng, Xiurui Xie, Li Huang, Huajin Tang
Abstract要約: スパイキングニューラルネットワーク(SNN)は、その高エネルギー効率のため、ニューロモルフィックなハードウェアに大きな可能性を秘めている。本稿では,Leakyインテグレート・アンド・ファイアニューロンとDeep Q-Networkに基づいて,直接学習した深部スパイキング強化学習アーキテクチャを提案する。我々の研究は、直接学習されたSNNを用いて、複数のAtariゲームで最先端のパフォーマンスを達成する最初のものである。
参考スコア（独自算出の注目度）: 16.268397551693862
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As the third-generation neural networks, Spiking Neural Networks (SNNs) have great potential on neuromorphic hardware because of their high energy-efficiency. However, Deep Spiking Reinforcement Learning (DSRL), i.e., the Reinforcement Learning (RL) based on SNNs, is still in its preliminary stage due to the binary output and the non-differentiable property of the spiking function. To address these issues, we propose a Deep Spiking Q-Network (DSQN) in this paper. Specifically, we propose a directly-trained deep spiking reinforcement learning architecture based on the Leaky Integrate-and-Fire (LIF) neurons and Deep Q-Network (DQN). Then, we adapt a direct spiking learning algorithm for the Deep Spiking Q-Network. We further demonstrate the advantages of using LIF neurons in DSQN theoretically. Comprehensive experiments have been conducted on 17 top-performing Atari games to compare our method with the state-of-the-art conversion method. The experimental results demonstrate the superiority of our method in terms of performance, stability, robustness and energy-efficiency. To the best of our knowledge, our work is the first one to achieve state-of-the-art performance on multiple Atari games with the directly-trained SNN.
Abstract（参考訳）: 第3世代のニューラルネットワークとして、スパイキングニューラルネットワーク(SNN)は、その高エネルギー効率のため、ニューロモルフィックなハードウェアに大きな可能性を秘めている。しかし,SNNに基づく強化学習(Reinforcement Learning, RL)である深スパイキング強化学習(Deep Spiking Reinforcement Learning, DSRL)は, 2次出力とスパイキング関数の非微分特性のため,まだ初期段階にある。本稿では,これらの問題に対処するために,Deep Spiking Q-Network (DSQN)を提案する。具体的には、Leaky Integrate-and-Fire(LIF)ニューロンとDeep Q-Network(DQN)に基づいて、直接学習した深部スパイキング強化学習アーキテクチャを提案する。次に、Deep Spiking Q-Networkに対して直接スパイキング学習アルゴリズムを適用する。さらに,理論上は LIF ニューロンを DSQN に使用することの利点を示す。提案手法を最先端変換法と比較するため,17種類のアタリゲームにおいて総合的な実験を行った。実験の結果, 性能, 安定性, 堅牢性, エネルギー効率の点で, 提案手法の優位性を示した。我々の知る限り、我々の研究は、直接学習されたSNNで複数のAtariゲームで最先端のパフォーマンスを達成する最初のものである。

関連論文リスト

A Self-Ensemble Inspired Approach for Effective Training of Binary-Weight Spiking Neural Networks [66.80058515743468]
トレーニングスパイキングニューラルネットワーク(SNN)とバイナリニューラルネットワーク(BNN)は、差別化不可能なスパイク生成機能のために困難である。本稿では, バックプロパゲーションプロセスの解析を通じて, SNN の力学とBNN との密接な関係を考察する。具体的には、複数のショートカットの構造と知識蒸留に基づくトレーニング技術を活用し、(バイナリウェイト)SNNのトレーニングを改善する。
論文参考訳（メタデータ） (2025-08-18T04:11:06Z)
Hardware-Aware Fine-Tuning of Spiking Q-Networks on the SpiNNaker2 Neuromorphic Platform [1.210742213461011]
Spiking Neural Networks(SNN)は、幅広いロボットタスクのためのニューロモルフィックハードウェアに対するレイテンシの低い消費電力と低いマグニチュード推論を約束する。本稿では,2つの古典的制御課題を解決するために,量子化されたSNNを用いた強化学習(RL)アルゴリズムをエネルギー効率よく実装する。このネットワークはQ-learningアルゴリズムを用いて訓練され、SpiNNaker2ニューロモルフィックチップに組み込むための微調整と量子化を低ビット(8ビット)の精度で行う。
論文参考訳（メタデータ） (2025-07-31T13:49:44Z)
Improving Performance of Spike-based Deep Q-Learning using Ternary Neurons [3.3062248565028463]
3次スパイクニューロンモデルの性能は、深部Q-ラーニングタスクにおける2次モデルよりも劣っていることを示す。本稿では,3次スパイクニューロンモデルを提案し,推定バイアスを低減してこの問題を軽減する。その結果, 提案した3次スパイクニューロンは, 学習課題における3次ニューロンの劇的な性能低下を緩和することがわかった。
論文参考訳（メタデータ） (2025-06-03T21:06:13Z)
Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control [59.65431931190187]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上で低レイテンシかつエネルギー効率の意思決定を提供する。連続制御のためのほとんどの連続制御アルゴリズムは、人工ニューラルネットワーク(ANN)のために設計されている。このミスマッチはSNNのトレーニングを不安定にし、性能を劣化させる。離散SNNと連続制御アルゴリズムのギャップを埋める新しいプロキシターゲットフレームワークを提案する。
論文参考訳（メタデータ） (2025-05-30T03:08:03Z)
Fully Spiking Actor Network with Intra-layer Connections for Reinforcement Learning [51.386945803485084]
エージェントが制御する多次元決定論的ポリシーを学習する必要があるタスクに焦点をあてる。既存のスパイクベースのRL法は、SNNの出力として発火率を取り、完全に接続された層を通して連続的なアクション空間(つまり決定論的なポリシー)を表すように変換する。浮動小数点行列操作を伴わない完全にスパイクするアクターネットワークを開発するため,昆虫に見られる非スパイク介在ニューロンからインスピレーションを得た。
論文参考訳（メタデータ） (2024-01-09T07:31:34Z)
SpikingJelly: An open-source machine learning infrastructure platform for spike-based intelligence [51.6943465041708]
スパイキングニューラルネットワーク(SNN)は、高エネルギー効率のニューロモルフィックチップに脳にインスパイアされたインテリジェンスを実現することを目的としている。我々は、ニューロモルフィックデータセットの事前処理、深層SNNの構築、パラメータの最適化、およびニューロモルフィックチップへのSNNのデプロイのためのフルスタックツールキットをコントリビュートする。
論文参考訳（メタデータ） (2023-10-25T13:15:17Z)
Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文参考訳（メタデータ） (2023-07-20T16:00:19Z)
Joint A-SNN: Joint Training of Artificial and Spiking Neural Networks via Self-Distillation and Weight Factorization [12.1610509770913]
スパイクニューラルネットワーク(SNN)は、脳ニューロンのスパイク特性を模倣する。我々は、ANNとSNNの合同トレーニングフレームワークを提案し、ANNはSNNの最適化をガイドできる。我々の手法は、他の多くの最先端の訓練方法より一貫して優れています。
論文参考訳（メタデータ） (2023-05-03T13:12:17Z)
SPIDE: A Purely Spike-based Method for Training Feedback Spiking Neural Networks [56.35403810762512]
イベントベースの計算を伴うスパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェアにおけるエネルギー効率の高い応用のために、脳にインスパイアされたモデルを約束している。本研究では,最近提案されたトレーニング手法を拡張した平衡状態(SPIDE)に対するスパイクに基づく暗黙差分法について検討した。
論文参考訳（メタデータ） (2023-02-01T04:22:59Z)
Solving the Spike Feature Information Vanishing Problem in Spiking Deep Q Network with Potential Based Normalization [7.796499799525251]
スパイキング深度Qネットワークを直接訓練するための電位ベース層正規化法(pbLN)を提案する。実験により,最先端のANN-SNN変換法や他のSDQN手法と比較して,提案したpbLNが深Qネットワーク(PL-SDQN)をスパイクすることで,Atariゲームタスクの性能が向上した。
論文参考訳（メタデータ） (2022-06-08T02:45:18Z)
Deep Reinforcement Learning with Spiking Q-learning [51.386945803485084]
スパイクニューラルネットワーク(SNN)は、少ないエネルギー消費で人工知能(AI)を実現することが期待されている。 SNNと深部強化学習(RL)を組み合わせることで、現実的な制御タスクに有望なエネルギー効率の方法を提供する。
論文参考訳（メタデータ） (2022-01-21T16:42:11Z)
Keys to Accurate Feature Extraction Using Residual Spiking Neural Networks [1.101002667958165]
スパイキングニューラルネットワーク(SNN)は、従来の人工ニューラルネットワーク(ANN)の代替として興味深いものになった本稿では,現代のスパイク建築の鍵となる構成要素について述べる。我々は、成功しているResNetアーキテクチャのスパイクバージョンを設計し、異なるコンポーネントとトレーニング戦略をテストする。
論文参考訳（メタデータ） (2021-11-10T21:29:19Z)
Effective and Efficient Computation with Multiple-timescale Spiking Recurrent Neural Networks [0.9790524827475205]
本稿では,新しいタイプの適応スパイクリカレントニューラルネットワーク(SRNN)が,最先端の性能を実現する方法を示す。我々は、従来のRNNよりも難しいタスクにおいて、SRNNの100倍のエネルギー改善を計算します。
論文参考訳（メタデータ） (2020-05-24T01:04:53Z)
Rectified Linear Postsynaptic Potential Function for Backpropagation in Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文参考訳（メタデータ） (2020-03-26T11:13:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。