論文の概要: T-NGA: Temporal Network Grafting Algorithm for Learning to Process
Spiking Audio Sensor Events
- arxiv url: http://arxiv.org/abs/2202.03204v1
- Date: Mon, 7 Feb 2022 14:14:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-26 15:21:33.119887
- Title: T-NGA: Temporal Network Grafting Algorithm for Learning to Process
Spiking Audio Sensor Events
- Title(参考訳): t-nga:スパイクオーディオセンサイベントの処理を学習するための時間的ネットワークグラフトアルゴリズム
- Authors: Shu Wang, Yuhuang Hu, Shih-Chii Liu
- Abstract要約: 本研究では、時間ネットワークグラフトアルゴリズム(T-NGA)と呼ばれる自己教師型手法を提案する。
T-NGAは、スペクトログラム機能で事前訓練されたリカレントネットワークをグラフトし、コチェリーイベント機能とネットワークを連携させる。
実験により, グラフトされたネットワークの精度は, 音声認識タスクにおけるスクラッチから訓練した教師ネットワークの精度と類似していることがわかった。
- 参考スコア(独自算出の注目度): 21.6437281441653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spiking silicon cochlea sensors encode sound as an asynchronous stream of
spikes from different frequency channels. The lack of labeled training datasets
for spiking cochleas makes it difficult to train deep neural networks on the
outputs of these sensors. This work proposes a self-supervised method called
Temporal Network Grafting Algorithm (T-NGA), which grafts a recurrent network
pretrained on spectrogram features so that the network works with the cochlea
event features. T-NGA training requires only temporally aligned audio
spectrograms and event features. Our experiments show that the accuracy of the
grafted network was similar to the accuracy of a supervised network trained
from scratch on a speech recognition task using events from a software spiking
cochlea model. Despite the circuit non-idealities of the spiking silicon
cochlea, the grafted network accuracy on the silicon cochlea spike recordings
was only about 5% lower than the supervised network accuracy using the
N-TIDIGITS18 dataset. T-NGA can train networks to process spiking audio sensor
events in the absence of large labeled spike datasets.
- Abstract(参考訳): シリコンコチェリーセンサーをスパイクすることで、異なる周波数チャネルからのスパイクの非同期ストリームとして音を符号化する。
ラベル付きトレーニングデータセットが欠如しているため、これらのセンサーの出力でディープニューラルネットワークをトレーニングすることは困難である。
本稿では,時間的ネットワークグラフト処理アルゴリズム(t-nga)と呼ばれる自己教師あり方式を提案する。
T-NGAトレーニングは、時間的に整列したオーディオスペクトログラムとイベント機能のみを必要とする。
実験の結果, グラフトネットワークの精度は, ソフトウェアスパイク・コチェリーモデルからのイベントを用いた音声認識タスクにおいて, スクラッチから訓練した教師ネットワークの精度に類似していることがわかった。
スパイキングシリコンコクリーの回路非理想性にもかかわらず, シリコンコクリースパイク記録におけるグラフトされたネットワーク精度は, N-TIDIGITS18データセットを用いた教師ネットワーク精度よりも約5%低かった。
T-NGAは、大きなラベル付きスパイクデータセットがない場合に、スパイクする音声センサイベントを処理するネットワークを訓練することができる。
関連論文リスト
- Sequential Learning from Noisy Data: Data-Assimilation Meets Echo-State
Network [0.0]
アンサンブルカルマンフィルタを用いた雑音観測を取り入れたエコー状態ネットワーク(ESN)のためのシーケンシャルトレーニングアルゴリズムを開発した。
その結果、カルマン訓練されたエコー状態ネットワーク(KalT-ESN)は、計算コストを抑えながら、最小二乗アルゴリズムで従来の訓練されたESNよりも優れていた。
論文 参考訳(メタデータ) (2023-04-01T02:03:08Z) - RN-Net: Reservoir Nodes-Enabled Neuromorphic Vision Sensing Network [7.112892720740359]
イベントベースのカメラは、生物学的視覚系のスパイクと非同期スパイク表現にインスパイアされている。
本稿では,局所的および大域的貯水池の動的時間エンコーディングと統合された単純な畳み込み層に基づくニューラルネットワークアーキテクチャを提案する。
RN-Netはこれまでに報告されたDV128 Gestureの99.2%の最高精度を達成しており、DVS Lipデータセットの67.5%の最高精度の1つである。
論文 参考訳(メタデータ) (2023-03-19T21:20:45Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - AEGNN: Asynchronous Event-based Graph Neural Networks [54.528926463775946]
イベントベースのグラフニューラルネットワークは、標準のGNNを一般化して、イベントを"進化的"時間グラフとして処理する。
AEGNNは同期入力で容易に訓練でき、テスト時に効率的な「非同期」ネットワークに変換できる。
論文 参考訳(メタデータ) (2022-03-31T16:21:12Z) - Mixed-Precision Neural Network Quantization via Learned Layer-wise
Importance [50.00102219630088]
混合精度量子化(MPQ)は各層に対して最適なビット幅を決定するのを難しくする。
本稿では,すべての指標を同時に取得できる共同学習手法を提案する。
例えば、ResNet18上のインデックスによるMPQ検索は、わずか0.06秒しかかからない。
論文 参考訳(メタデータ) (2022-03-16T03:23:50Z) - Hybrid SNN-ANN: Energy-Efficient Classification and Object Detection for
Event-Based Vision [64.71260357476602]
イベントベースの視覚センサは、画像フレームではなく、イベントストリームの局所的な画素単位の明るさ変化を符号化する。
イベントベースセンサーによる物体認識の最近の進歩は、ディープニューラルネットワークの変換によるものである。
本稿では、イベントベースのパターン認識とオブジェクト検出のためのディープニューラルネットワークのエンドツーエンドトレーニングのためのハイブリッドアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-06T23:45:58Z) - Robust and fast post-processing of single-shot spin qubit detection
events with a neural network [0.0]
我々は、単発スピン検出イベントの集合を分類するためにニューラルネットワークを訓練する。
その結果,Rabi-oscillationの可視性は7%向上した。
論文 参考訳(メタデータ) (2020-12-08T19:13:09Z) - Enabling certification of verification-agnostic networks via
memory-efficient semidefinite programming [97.40955121478716]
本稿では,ネットワークアクティベーションの総数にのみ線形なメモリを必要とする一階二重SDPアルゴリズムを提案する。
L-inf の精度は 1% から 88% ,6% から 40% に改善した。
また,変分オートエンコーダの復号器に対する2次安定性仕様の厳密な検証を行った。
論文 参考訳(メタデータ) (2020-10-22T12:32:29Z) - Event-Based Backpropagation can compute Exact Gradients for Spiking
Neural Networks [0.0]
スパイクニューラルネットワークは、離散スパイクを用いたアナログ計算とイベントベースの通信を組み合わせる。
この研究は、連続時間スパイクニューラルネットワークと一般損失関数のバックプロパゲーションアルゴリズムを初めて導いた。
EventProp経由で計算した勾配を用いて,スパイク時間あるいは電圧に基づく損失関数を用いて,Yin-YangおよびMNISTデータセット上のネットワークをトレーニングし,競合性能を報告する。
論文 参考訳(メタデータ) (2020-09-17T15:45:00Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。