論文の概要: Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network
- arxiv url: http://arxiv.org/abs/2007.03274v1
- Date: Tue, 7 Jul 2020 08:22:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 19:51:59.712908
- Title: Multi-Tones' Phase Coding (MTPC) of Interaural Time Difference by
Spiking Neural Network
- Title(参考訳): スパイクニューラルネットワークによる音節間時間差のマルチトーン位相符号化(MTPC)
- Authors: Zihan Pan, Malu Zhang, Jibin Wu, Haizhou Li
- Abstract要約: 雑音の多い実環境下での正確な音像定位のための純粋スパイクニューラルネットワーク(SNN)に基づく計算モデルを提案する。
このアルゴリズムを,マイクロホンアレイを用いたリアルタイムロボットシステムに実装する。
実験の結果, 平均誤差方位は13度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回っていることがわかった。
- 参考スコア(独自算出の注目度): 68.43026108936029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inspired by the mammal's auditory localization pathway, in this paper we
propose a pure spiking neural network (SNN) based computational model for
precise sound localization in the noisy real-world environment, and implement
this algorithm in a real-time robotic system with a microphone array. The key
of this model relies on the MTPC scheme, which encodes the interaural time
difference (ITD) cues into spike patterns. This scheme naturally follows the
functional structures of the human auditory localization system, rather than
artificially computing of time difference of arrival. Besides, it highlights
the advantages of SNN, such as event-driven and power efficiency. The MTPC is
pipelined with two different SNN architectures, the convolutional SNN and
recurrent SNN, by which it shows the applicability to various SNNs. This
proposal is evaluated by the microphone collected location-dependent acoustic
data, in a real-world environment with noise, obstruction, reflection, or other
affects. The experiment results show a mean error azimuth of 1~3 degrees, which
surpasses the accuracy of the other biologically plausible neuromorphic
approach for sound source localization.
- Abstract(参考訳): 哺乳類の聴覚的局所化経路にインスパイアされた本論文では、雑音の多い実環境における正確な音像定位のための純粋スパイキングニューラルネットワーク(SNN)に基づく計算モデルを提案し、マイクロホンアレイを用いたリアルタイムロボットシステムにこのアルゴリズムを実装した。
このモデルの鍵は、音間時間差(ITD)キューをスパイクパターンに符号化するMTPC方式に依存している。
このスキームは、到着の時間差を人為的に計算するのではなく、自然に人間の聴覚定位システムの機能構造に従う。
さらに、イベント駆動や電力効率といったSNNの利点を強調している。
MTPCは2つの異なるSNNアーキテクチャ、すなわち畳み込みSNNと繰り返しSNNでパイプラインされ、様々なSNNに適用可能であることを示す。
本提案は, 雑音, 妨害, 反射, その他の影響のある実環境において, マイクロホンが収集した位置依存音響データを用いて評価する。
実験の結果, 平均誤差方位は1~3度であり, 音源定位に対する他の生物学的に妥当なニューロモルフィックアプローチの精度を上回ることがわかった。
関連論文リスト
- Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングでは、スパイクニューラルネットワーク(SNN)が推論タスクを実行し、シーケンシャルデータを含むワークロードの大幅な効率向上を提供する。
ハードウェアとソフトウェアの最近の進歩は、スパイクニューロン間で交換された各スパイクに数ビットのペイロードを埋め込むことにより、推論精度をさらに高めることを示した。
本稿では,マルチレベルSNNを用いた無線ニューロモルフィック分割計算アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - Accurate Mapping of RNNs on Neuromorphic Hardware with Adaptive Spiking Neurons [2.9410174624086025]
我々は、SigmaDelta$-low-pass RNN(lpRNN)を、レートベースのRNNをスパイクニューラルネットワーク(SNN)にマッピングするために提示する。
適応スパイキングニューロンモデルは、$SigmaDelta$-modulationを使って信号を符号化し、正確なマッピングを可能にする。
我々は、Intelのニューロモルフィック研究チップLoihiにおけるlpRNNの実装を実演する。
論文 参考訳(メタデータ) (2024-07-18T14:06:07Z) - Dual input neural networks for positional sound source localization [19.07039703121673]
本稿では、これらの2つのデータ型をニューラルネットワークでモデル化するための、単純かつ効果的な方法として、Dual Input Neural Networks(DI-NN)を紹介する。
難易度と現実性の異なるシナリオに基づいて提案したDI-NNをトレーニングし、評価し、代替アーキテクチャと比較する。
以上の結果から,DI-NNはLS法よりも5倍,CRNNより2倍低い位置推定誤差を達成できることがわかった。
論文 参考訳(メタデータ) (2023-08-08T09:59:56Z) - Time-Parameterized Convolutional Neural Networks for Irregularly Sampled
Time Series [26.77596449192451]
不規則にサンプリングされた時系列は、いくつかのアプリケーション領域でユビキタスであり、スパースであり、完全に観測されていない、非整合的な観察に繋がる。
標準シーケンシャルニューラルネットワーク(RNN)と畳み込みニューラルネットワーク(CNN)は、観測時間間の定期的な間隔を考慮し、不規則な時系列モデリングに重大な課題を提起する。
時間的に不規則なカーネルを用いて畳み込み層をパラメータ化する。
論文 参考訳(メタデータ) (2023-08-06T21:10:30Z) - Bayesian Neural Network Language Modeling for Speech Recognition [59.681758762712754]
長期記憶リカレントニューラルネットワーク(LSTM-RNN)とトランスフォーマーで表される最先端のニューラルネットワーク言語モデル(NNLM)は非常に複雑になりつつある。
本稿では,LSTM-RNN と Transformer LM の基盤となる不確実性を考慮するために,ベイズ学習フレームワークの全体構造を提案する。
論文 参考訳(メタデータ) (2022-08-28T17:50:19Z) - Time-Frequency Localization Using Deep Convolutional Maxout Neural
Network in Persian Speech Recognition [0.0]
一部の哺乳類の聴覚ニューロン系における時間周波数の柔軟性は、認識性能を向上させる。
本稿では,ASR音響モデルにおける音声信号情報の時間的局所化のためのCNNに基づく構造を提案する。
TFCMNNモデルの平均認識スコアは、従来のモデルの平均よりも約1.6%高い。
論文 参考訳(メタデータ) (2021-08-09T05:46:58Z) - PILOT: Introducing Transformers for Probabilistic Sound Event
Localization [107.78964411642401]
本稿では,受信したマルチチャンネル音声信号の時間的依存性を自己アテンション機構によってキャプチャする,トランスフォーマーに基づく新しい音声イベント定位フレームワークを提案する。
このフレームワークは, 公開されている3つの音声イベントローカライズデータセットを用いて評価し, 局所化誤差と事象検出精度の点で最先端の手法と比較した。
論文 参考訳(メタデータ) (2021-06-07T18:29:19Z) - Neural Architecture Search For LF-MMI Trained Time Delay Neural Networks [61.76338096980383]
TDNN(State-of-the-the-art Factored Time delay Neural Network)の2種類のハイパーパラメータを自動的に学習するために、さまざまなニューラルネットワークサーチ(NAS)技術が使用されている。
DARTSメソッドはアーキテクチャ選択とLF-MMI(格子のないMMI)TDNNトレーニングを統合する。
300時間のSwitchboardコーパスで行われた実験では、自動構成システムはベースラインLF-MMI TDNNシステムより一貫して優れていることが示唆された。
論文 参考訳(メタデータ) (2020-07-17T08:32:11Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。