論文の概要: A Multi-view CNN-based Acoustic Classification System for Automatic
Animal Species Identification
- arxiv url: http://arxiv.org/abs/2002.09821v1
- Date: Sun, 23 Feb 2020 03:51:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 09:59:56.141011
- Title: A Multi-view CNN-based Acoustic Classification System for Automatic
Animal Species Identification
- Title(参考訳): 動物自動識別のための多視点cnnに基づく音響分類システム
- Authors: Weitao Xu, Xiang Zhang, Lina Yao, Wanli Xue, Bo Wei
- Abstract要約: 無線音響センサネットワーク(WASN)のためのディープラーニングに基づく音響分類フレームワークを提案する。
提案フレームワークは,無線センサノードの計算負担を緩和するクラウドアーキテクチャに基づいている。
認識精度を向上させるために,多視点畳み込みニューラルネットワーク(CNN)を設計し,短期・中期・長期の依存関係を並列に抽出する。
- 参考スコア(独自算出の注目度): 42.119250432849505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic identification of animal species by their vocalization is an
important and challenging task. Although many kinds of audio monitoring system
have been proposed in the literature, they suffer from several disadvantages
such as non-trivial feature selection, accuracy degradation because of
environmental noise or intensive local computation. In this paper, we propose a
deep learning based acoustic classification framework for Wireless Acoustic
Sensor Network (WASN). The proposed framework is based on cloud architecture
which relaxes the computational burden on the wireless sensor node. To improve
the recognition accuracy, we design a multi-view Convolution Neural Network
(CNN) to extract the short-, middle-, and long-term dependencies in parallel.
The evaluation on two real datasets shows that the proposed architecture can
achieve high accuracy and outperforms traditional classification systems
significantly when the environmental noise dominate the audio signal (low SNR).
Moreover, we implement and deploy the proposed system on a testbed and analyse
the system performance in real-world environments. Both simulation and
real-world evaluation demonstrate the accuracy and robustness of the proposed
acoustic classification system in distinguishing species of animals.
- Abstract(参考訳): 声化による動物種の自動識別は重要かつ困難な課題である。
文献では様々な種類の音声監視システムが提案されているが、非自明な特徴選択、環境騒音による精度劣化、集中的な局所計算などの欠点に悩まされている。
本稿では,無線音響センサネットワーク(WASN)のためのディープラーニングに基づく音響分類フレームワークを提案する。
提案するフレームワークは,無線センサノードの計算負荷を緩和するクラウドアーキテクチャに基づいている。
認識精度を向上させるために,多視点畳み込みニューラルネットワーク(CNN)を設計し,短期・中期・長期の依存関係を並列に抽出する。
2つの実データセットの評価結果から,環境騒音が音声信号(低SNR)を支配している場合,提案手法は精度が高く,従来の分類システムよりも優れていた。
さらに,提案するシステムをテストベッドに実装・デプロイし,実環境におけるシステム性能の分析を行う。
シミュレーションと実世界評価は,動物種の識別における音響分類システムの精度と堅牢性を示すものである。
関連論文リスト
- Advanced Framework for Animal Sound Classification With Features Optimization [35.2832738406242]
一般的な動物音響分類に適用可能な自動分類フレームワークを提案する。
提案手法は,精度,リコール,精度を25%以上向上させる。
論文 参考訳(メタデータ) (2024-07-03T18:33:47Z) - Probing the Information Encoded in Neural-based Acoustic Models of
Automatic Speech Recognition Systems [7.207019635697126]
本稿では,自動音声認識音響モデル(AM)における情報の位置と位置を決定することを目的とする。
話者検証,音響環境分類,性別分類,テンポ歪検出システム,音声感情・感情識別について実験を行った。
分析の結果、ニューラルベースAMは驚くほど音素認識と無関係に思える異種情報を持っていることがわかった。
論文 参考訳(メタデータ) (2024-02-29T18:43:53Z) - Wider or Deeper Neural Network Architecture for Acoustic Scene
Classification with Mismatched Recording Devices [59.86658316440461]
音響シーン分類(ASC)のためのロバストで低複雑性なシステムを提案する。
本稿では,まず,新しい入出力型ネットワークアーキテクチャを設計し,不一致な記録装置問題に対処する,ASCベースラインシステムを構築する。
さらなる性能向上を図りながら、低複雑性モデルを満たすために、多重スペクトルのアンサンブルとチャネル縮小の2つの手法を適用した。
論文 参考訳(メタデータ) (2022-03-23T10:27:41Z) - Animal Behavior Classification via Deep Learning on Embedded Systems [10.160218445628836]
我々は,動物行動の分類を加速度計測データを用いてエンドツーエンドのディープ・ニューラル・ネットワーク・ベース・アルゴリズムを開発した。
動物行動のin-situ分類を行うために,カラータグのAIoTデバイスの組込みシステムに提案アルゴリズムを実装した。
論文 参考訳(メタデータ) (2021-11-24T06:26:15Z) - PILOT: Introducing Transformers for Probabilistic Sound Event
Localization [107.78964411642401]
本稿では,受信したマルチチャンネル音声信号の時間的依存性を自己アテンション機構によってキャプチャする,トランスフォーマーに基づく新しい音声イベント定位フレームワークを提案する。
このフレームワークは, 公開されている3つの音声イベントローカライズデータセットを用いて評価し, 局所化誤差と事象検出精度の点で最先端の手法と比較した。
論文 参考訳(メタデータ) (2021-06-07T18:29:19Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Deep Speaker Embeddings for Far-Field Speaker Recognition on Short
Utterances [53.063441357826484]
深層話者埋め込みに基づく話者認識システムは,制御条件下での大幅な性能向上を実現している。
制御されていない雑音環境下での短い発話に対する話者検証は、最も困難で要求の高いタスクの1つである。
本稿では,a)環境騒音の有無による遠距離話者検証システムの品質向上,b)短時間発話におけるシステム品質劣化の低減という2つの目標を達成するためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-14T13:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。