論文の概要: DD-CNN: Depthwise Disout Convolutional Neural Network for Low-complexity
Acoustic Scene Classification
- arxiv url: http://arxiv.org/abs/2007.12864v1
- Date: Sat, 25 Jul 2020 06:02:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 01:27:02.841680
- Title: DD-CNN: Depthwise Disout Convolutional Neural Network for Low-complexity
Acoustic Scene Classification
- Title(参考訳): DD-CNN:低複雑さ音響シーン分類のための奥行き畳み込みニューラルネットワーク
- Authors: Jingqiao Zhao, Zhen-Hua Feng, Qiuqiang Kong, Xiaoning Song, Xiao-Jun
Wu
- Abstract要約: 本稿では,都市音響シーンの検出と分類を行うために,Depthwise Disout Convolutional Neural Network (DD-CNN)を提案する。
ネットワークの入力に音響信号の特徴表現としてlog-melを用いる。
提案したDD-CNNでは,ネットワークの複雑さを軽減するために,深度的に分離可能な畳み込みが用いられている。
- 参考スコア(独自算出の注目度): 29.343805468175965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a Depthwise Disout Convolutional Neural Network (DD-CNN)
for the detection and classification of urban acoustic scenes. Specifically, we
use log-mel as feature representations of acoustic signals for the inputs of
our network. In the proposed DD-CNN, depthwise separable convolution is used to
reduce the network complexity. Besides, SpecAugment and Disout are used for
further performance boosting. Experimental results demonstrate that our DD-CNN
can learn discriminative acoustic characteristics from audio fragments and
effectively reduce the network complexity. Our DD-CNN was used for the
low-complexity acoustic scene classification task of the DCASE2020 Challenge,
which achieves 92.04% accuracy on the validation set.
- Abstract(参考訳): 本稿では,都市音響シーンの検出と分類のためのDepthwise Disout Convolutional Neural Network (DD-CNN)を提案する。
具体的には,ネットワークの入力に対する音響信号の特徴表現としてlog-melを用いる。
提案するdd-cnnでは,ネットワークの複雑さを軽減するために奥行き分離可能な畳み込みが用いられる。
さらに、SpecAugmentとDisoutはさらなるパフォーマンス向上に使用される。
実験の結果,DD-CNNは音声断片から識別音響特性を学習し,ネットワークの複雑さを効果的に低減できることがわかった。
DD-CNNはDCASE2020 Challengeの低複雑さ音響シーン分類タスクに利用され,92.04%の精度で検証を行った。
関連論文リスト
- Noise Adaptor: Enhancing Low-Latency Spiking Neural Networks through Noise-Injected Low-Bit ANN Conversion [3.8674054882510065]
雑音適応器は、競争力のある低遅延スパイクニューラルネットワーク(SNN)を構築するための新しい方法である
量子化ANNトレーニング中にノイズを注入することにより、ノイズアダプタはANNとSNNの動的差異をよりよく考慮する。
従来の手法とは異なり、ノイズアダプタはSNNにおける実行時ノイズ補正技術の適用を必要としない。
論文 参考訳(メタデータ) (2024-11-26T13:39:52Z) - TBSN: Transformer-Based Blind-Spot Network for Self-Supervised Image Denoising [94.09442506816724]
BSN(Blind-spot Network)は、自己教師型イメージデノベーション(SSID)において一般的なネットワークアーキテクチャである。
本稿では, ブラインドスポット要求を満たす変圧器演算子の解析と再設計により, 変圧器ベースブラインドスポットネットワーク(TBSN)を提案する。
空間的自己注意のために、注意行列に精巧なマスクを適用して受容場を制限し、拡張された畳み込みを模倣する。
チャネル自己アテンションについては,マルチスケールアーキテクチャの深層部において,チャネル数が空間的サイズよりも大きい場合,盲点情報を漏洩する可能性がある。
論文 参考訳(メタデータ) (2024-04-11T15:39:10Z) - sVAD: A Robust, Low-Power, and Light-Weight Voice Activity Detection
with Spiking Neural Networks [51.516451451719654]
スパイキングニューラルネットワーク(SNN)は生物学的に妥当で、電力効率が高いことが知られている。
本稿では sVAD と呼ばれる新しい SNN ベースの音声活動検出モデルを提案する。
SincNetと1D畳み込みによる効果的な聴覚特徴表現を提供し、アテンション機構による雑音の堅牢性を向上させる。
論文 参考訳(メタデータ) (2024-03-09T02:55:44Z) - Hopfield-Enhanced Deep Neural Networks for Artifact-Resilient Brain
State Decoding [0.0]
そこで本研究では, ホップフィールド・ネットワークとコナール・ニューラル・ネットワーク(CNN)を併用した2段階の計算手法を提案する。
様々なレベルのデータ圧縮とノイズ強度のパフォーマンスは、我々のフレームワークがアーティファクトを効果的に軽減し、より低いノイズレベルにおいてクリーンなデータCNNと同等の精度でモデルに到達できることを示しました。
論文 参考訳(メタデータ) (2023-11-06T15:08:13Z) - Spiking Neural Network Decision Feedback Equalization [70.3497683558609]
決定フィードバック等化器(DFE)に似たフィードバック構造を持つSNNベースの等化器を提案する。
提案手法は,3種類の模範チャネルに対して,従来の線形等化器よりも明らかに優れていることを示す。
決定フィードバック構造を持つSNNは、競合エネルギー効率の良いトランシーバへのパスを可能にする。
論文 参考訳(メタデータ) (2022-11-09T09:19:15Z) - Noise Injection as a Probe of Deep Learning Dynamics [0.0]
ノイズインジェクションノード(NIN)を用いたシステム摂動により,ディープニューラルネットワーク(DNN)の学習メカニズムを探索する新しい手法を提案する。
このシステムは,音の音量によって予測される訓練中に異なる位相を呈することがわかった。
ノイズノードの進化は、乱れのない損失のそれと似ており、NINを使って将来、完全なシステムについてより深く学ぶ可能性を示している。
論文 参考訳(メタデータ) (2022-10-24T20:51:59Z) - Training High-Performance Low-Latency Spiking Neural Networks by
Differentiation on Spike Representation [70.75043144299168]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上に実装された場合、有望なエネルギー効率のAIモデルである。
非分化性のため、SNNを効率的に訓練することは困難である。
本稿では,ハイパフォーマンスを実現するスパイク表現法(DSR)の差分法を提案する。
論文 参考訳(メタデータ) (2022-05-01T12:44:49Z) - Noise Sensitivity-Based Energy Efficient and Robust Adversary Detection
in Neural Networks [3.125321230840342]
逆の例は、愚かな分類器ネットワークに注意深く浸透した入力であり、一方で人間には変化がない。
本稿では,深層ニューラルネットワーク(DNN)を検出器サブネットワークで拡張する構造化手法を提案する。
本手法は,実例に対する最先端検出器のロバスト性が向上することを示す。
論文 参考訳(メタデータ) (2021-01-05T14:31:53Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - Attention Driven Fusion for Multi-Modal Emotion Recognition [39.295892047505816]
本稿では,感情分類のためのテキストと音響データを活用・融合するための深層学習に基づくアプローチを提案する。
我々は、帯域通過フィルタを用いたパラメータ化シンク関数に基づくSincNet層を用いて、生音声から音響特徴を抽出し、DCNNで処理する。
テキスト処理では,N-gramレベルの相関を推定するために,2つの分岐(DCNNとBi-direction RNNとDCNN)を並列に使用する。
論文 参考訳(メタデータ) (2020-09-23T08:07:58Z) - Progressive Tandem Learning for Pattern Recognition with Deep Spiking
Neural Networks [80.15411508088522]
スパイキングニューラルネットワーク(SNN)は、低レイテンシと高い計算効率のために、従来の人工知能ニューラルネットワーク(ANN)よりも優位性を示している。
高速かつ効率的なパターン認識のための新しいANN-to-SNN変換およびレイヤワイズ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-02T15:38:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。