論文の概要: Low-power SNN-based audio source localisation using a Hilbert Transform
spike encoding scheme
- arxiv url: http://arxiv.org/abs/2402.11748v1
- Date: Mon, 19 Feb 2024 00:21:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 19:21:28.569802
- Title: Low-power SNN-based audio source localisation using a Hilbert Transform
spike encoding scheme
- Title(参考訳): ヒルベルト変換スパイク符号化方式を用いた低消費電力SNN音源定位
- Authors: Saeid Haghighatshoar and Dylan R Muir
- Abstract要約: 音源の定位は、個々のスピーカーから音声を分離し、ノイズを除去するために、多くの家電機器で使われている。
超低消費電力スパイキングニューラルネットワーク(SNN)の効率的な実装を目的とした任意のマイクロホンアレイにおける音源定位手法を提案する。
提案手法は,従来の非SNN超解像法に匹敵する,SNN法における最先端の精度を実現する。
- 参考スコア(独自算出の注目度): 5.312109949216556
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Sound source localisation is used in many consumer electronics devices, to
help isolate audio from individual speakers and to reject noise. Localization
is frequently accomplished by "beamforming" algorithms, which combine
microphone audio streams to improve received signal power from particular
incident source directions. Beamforming algorithms generally use knowledge of
the frequency components of the audio source, along with the known microphone
array geometry, to analytically phase-shift microphone streams before combining
them. A dense set of band-pass filters is often used to obtain known-frequency
"narrowband" components from wide-band audio streams. These approaches achieve
high accuracy, but state of the art narrowband beamforming algorithms are
computationally demanding, and are therefore difficult to integrate into
low-power IoT devices. We demonstrate a novel method for sound source
localisation in arbitrary microphone arrays, designed for efficient
implementation in ultra-low-power spiking neural networks (SNNs). We use a
novel short-time Hilbert transform (STHT) to remove the need for demanding
band-pass filtering of audio, and introduce a new accompanying method for audio
encoding with spiking events. Our beamforming and localisation approach
achieves state-of-the-art accuracy for SNN methods, and comparable with
traditional non-SNN super-resolution approaches. We deploy our method to
low-power SNN audio inference hardware, and achieve much lower power
consumption compared with super-resolution methods. We demonstrate that signal
processing approaches can be co-designed with spiking neural network
implementations to achieve high levels of power efficiency. Our new
Hilbert-transform-based method for beamforming promises to also improve the
efficiency of traditional DSP-based signal processing.
- Abstract(参考訳): 音源ローカライズは多くの家電機器で使われ、個々のスピーカーからオーディオを分離し、ノイズを拒否するのに役立つ。
ローカライゼーションは、マイクロホンオーディオストリームを組み合わせて特定のインシデントソース方向から受信した信号パワーを改善する"ビーアフォーミング"アルゴリズムによってしばしば達成される。
ビームフォーミングアルゴリズムは一般に、音声ソースの周波数成分と既知のマイクロフォンアレイの形状の知識を用いて、それらを結合する前に位相シフトマイクロホンストリームの分析を行う。
帯域通過フィルタの高密度セットは、広帯域オーディオストリームから既知の周波数の「狭帯域」成分を得るためにしばしば用いられる。
これらのアプローチは高い精度を達成するが、最先端の狭帯域ビームフォーミングアルゴリズムは計算上要求されるため、低消費電力iotデバイスへの統合は困難である。
超低消費電力スパイキングニューラルネットワーク(SNN)の効率的な実装を目的とした,任意のマイクロホンアレイにおける音源定位手法を提案する。
我々は,新しい短時間ヒルベルト変換(stht)を用いて,音声の帯域通過フィルタの必要性をなくし,スパイクイベントを伴う音声符号化の新たな手法を提案する。
我々のビームフォーミング・ローカライゼーション手法は,従来の非SNN超解像法に匹敵する,SNN手法の最先端精度を実現する。
提案手法を低消費電力SNN音声推論ハードウェアに展開し,超解像法と比較して低消費電力化を実現している。
我々は,信号処理手法をスパイクニューラルネットワークの実装と協調して高レベルの電力効率を実現することを実証する。
我々の新しいヒルベルト変換を用いたビームフォーミング法は、従来のDSPベースの信号処理の効率を向上させる。
関連論文リスト
- Power-Efficient Indoor Localization Using Adaptive Channel-aware
Ultra-wideband DL-TDOA [7.306334571814026]
本稿では,低消費電力チャネル対応動的周波数DL-TDOAレンジリングアルゴリズムの提案と実装を行う。
畳み込みニューラルネットワーク(CNN)、ダイナミックレンジング周波数制御モジュール、IMUセンサベースのレンジングフィルタに基づくNLOS確率予測器を備える。
論文 参考訳(メタデータ) (2024-02-16T09:04:04Z) - Dual input neural networks for positional sound source localization [19.07039703121673]
本稿では、これらの2つのデータ型をニューラルネットワークでモデル化するための、単純かつ効果的な方法として、Dual Input Neural Networks(DI-NN)を紹介する。
難易度と現実性の異なるシナリオに基づいて提案したDI-NNをトレーニングし、評価し、代替アーキテクチャと比較する。
以上の結果から,DI-NNはLS法よりも5倍,CRNNより2倍低い位置推定誤差を達成できることがわかった。
論文 参考訳(メタデータ) (2023-08-08T09:59:56Z) - Spiking Neural Network Decision Feedback Equalization [70.3497683558609]
決定フィードバック等化器(DFE)に似たフィードバック構造を持つSNNベースの等化器を提案する。
提案手法は,3種類の模範チャネルに対して,従来の線形等化器よりも明らかに優れていることを示す。
決定フィードバック構造を持つSNNは、競合エネルギー効率の良いトランシーバへのパスを可能にする。
論文 参考訳(メタデータ) (2022-11-09T09:19:15Z) - Simple Pooling Front-ends For Efficient Audio Classification [56.59107110017436]
入力音声特徴量における時間的冗長性を排除することは,効率的な音声分類に有効な方法である可能性が示唆された。
本稿では、単純な非パラメトリックプーリング操作を用いて冗長な情報を削減する単純なプールフロントエンド(SimPFs)のファミリーを提案する。
SimPFは、市販オーディオニューラルネットワークの浮動小数点演算数の半数以上を削減できる。
論文 参考訳(メタデータ) (2022-10-03T14:00:41Z) - Efficient spike encoding algorithms for neuromorphic speech recognition [5.182266520875928]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックプロセッサの実装に非常に効果的である。
実値信号は、SNNに適さない実値信号として符号化される。
本稿では,話者独立桁分類システムにおける4つのスパイク符号化手法について検討する。
論文 参考訳(メタデータ) (2022-07-14T17:22:07Z) - Optimal quantum control via genetic algorithms for quantum state
engineering in driven-resonator mediated networks [68.8204255655161]
進化的アルゴリズムに基づく量子状態工学には、機械学習によるアプローチを採用しています。
我々は、単一のモード駆動マイクロ波共振器を介して相互作用する、量子ビットのネットワーク(直接結合のない人工原子の状態に符号化された)を考える。
アルゴリズムは理想的なノイズフリー設定で訓練されているにもかかわらず、高い量子忠実度とノイズに対するレジリエンスを観測する。
論文 参考訳(メタデータ) (2022-06-29T14:34:00Z) - Acoustic-Net: A Novel Neural Network for Sound Localization and
Quantification [28.670240455952317]
アコースティックネットと呼ばれる新しいニューラルネットワークが提案され、音源の特定と定量化が可能である。
実験により,提案手法は音源予測の精度と計算速度を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2022-03-31T12:20:09Z) - Frequency-bin entanglement from domain-engineered down-conversion [101.18253437732933]
フィルタや共振器の共振器を用いない離散周波数ビン絡みの単一パス源を提案する。
ドメインエンジニアリングされた非線形結晶を用いて、通信波長で8モードの周波数ビン絡み合った光源を生成する。
論文 参考訳(メタデータ) (2022-01-18T19:00:29Z) - Mixed Precision Low-bit Quantization of Neural Network Language Models
for Speech Recognition [67.95996816744251]
長期間のメモリリカレントニューラルネットワーク(LSTM-RNN)とトランスフォーマーで表される最先端言語モデル(LM)は、実用アプリケーションではますます複雑で高価なものになりつつある。
現在の量子化法は、均一な精度に基づいており、量子化誤差に対するLMの異なる部分での様々な性能感度を考慮できない。
本稿では,新しい混合精度ニューラルネットワークLM量子化法を提案する。
論文 参考訳(メタデータ) (2021-11-29T12:24:02Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Using deep learning to understand and mitigate the qubit noise
environment [0.0]
本稿では,量子ビット上の時間力学測定から正確な雑音スペクトルを抽出する手法を提案する。
任意の浴槽に囲まれた任意のキュービットに付随する雑音スペクトルを抽出するニューラルネットワークに基づく手法を実証する。
この結果は、様々なキュービットプラットフォームに適用でき、キュービット性能を改善するためのフレームワークを提供する。
論文 参考訳(メタデータ) (2020-05-03T17:13:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。