論文の概要: Anomalous Sound Detection using unsupervised and semi-supervised
autoencoders and gammatone audio representation
- arxiv url: http://arxiv.org/abs/2006.15321v1
- Date: Sat, 27 Jun 2020 08:25:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 08:17:01.539389
- Title: Anomalous Sound Detection using unsupervised and semi-supervised
autoencoders and gammatone audio representation
- Title(参考訳): 教師なし・半教師付きオートエンコーダとガンマトン音響表現を用いた異常音検出
- Authors: Sergi Perez-Castanos, Javier Naranjo-Alcazar, Pedro Zuccarello and
Maximo Cobos
- Abstract要約: 本稿では,畳み込みオートエンコーダとガンマトーンに基づく音声表現に基づく新しいフレームワークを提案する。
機械の故障や損傷を早期に検出することは、大きな節約と産業プロセスの効率の向上を意味する可能性がある。
- 参考スコア(独自算出の注目度): 4.591851728010269
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomalous sound detection (ASD) is, nowadays, one of the topical subjects in
machine listening discipline. Unsupervised detection is attracting a lot of
interest due to its immediate applicability in many fields. For example,
related to industrial processes, the early detection of malfunctions or damage
in machines can mean great savings and an improvement in the efficiency of
industrial processes. This problem can be solved with an unsupervised ASD
solution since industrial machines will not be damaged simply by having this
audio data in the training stage. This paper proposes a novel framework based
on convolutional autoencoders (both unsupervised and semi-supervised) and a
Gammatone-based representation of the audio. The results obtained by these
architectures substantially exceed the results presented as a baseline.
- Abstract(参考訳): 異常音検出(ASD)は近年,機械聴取分野における話題の一つとなっている。
教師なし検出は、多くの分野ですぐに適用できるため、多くの関心を集めている。
例えば、産業プロセスに関連して、機械の故障や損傷を早期に検出することは、大きな節約と産業プロセスの効率の向上を意味する。
この問題は、このオーディオデータをトレーニング段階で持つだけでは産業機械が損傷を受けないため、教師なしのSDソリューションで解決できる。
本稿では,畳み込み型オートエンコーダ(教師なしと半教師付きの両方)とガンマトンに基づく音声表現に基づく新しいフレームワークを提案する。
これらのアーキテクチャによって得られた結果は、ベースラインとして提示された結果を大幅に上回る。
関連論文リスト
- Acoustic Signal Analysis with Deep Neural Network for Detecting Fault
Diagnosis in Industrial Machines [0.0]
本研究では,産業機械が生み出す音声信号を分析するための深層学習システムについて検討した。
提案手法の精度は97.17%から99.87%まで変化した。
論文 参考訳(メタデータ) (2023-12-02T08:09:27Z) - Unsupervised Anomaly Detection and Localization of Machine Audio: A
GAN-based Approach [17.85309428707623]
AEGAN-ADは、入力スペクトログラムを再構成するためにジェネレータを訓練する全く教師なしのアプローチである。
DCASE 2022 Challenge TASK 2のデータセット上でのAEGAN-ADの性能は、最先端の結果を示している。
論文 参考訳(メタデータ) (2023-03-31T10:27:36Z) - Deepfake audio detection by speaker verification [79.99653758293277]
本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。
提案手法は,既成話者検証ツールに基づいて実装することができる。
そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
論文 参考訳(メタデータ) (2022-09-28T13:46:29Z) - Should All Proposals be Treated Equally in Object Detection? [110.27485090952385]
オブジェクト検出器の複雑さと精度のトレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。
検出効率の改善には、提案の不平等な処理に向けて、パラダイムシフトが必要であると仮定されている。
これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
論文 参考訳(メタデータ) (2022-07-07T18:26:32Z) - Canonical Polyadic Decomposition and Deep Learning for Machine Fault
Detection [0.0]
マシンからあらゆる種類の障害を学ぶのに十分なデータを集めることは不可能である。
健康状態のみのデータを用いてトレーニングされた新しいアルゴリズムを開発し、教師なしの異常検出を行った。
これらのアルゴリズムの開発における重要な問題は、異常検出性能に影響を与える信号のノイズである。
論文 参考訳(メタデータ) (2021-07-20T14:06:50Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Deep Dense and Convolutional Autoencoders for Unsupervised Anomaly
Detection in Machine Condition Sounds [55.18259748448095]
本報告では,DCASE 2020 チャレンジの第2タスクのために開発された2つの手法について述べる。
この課題には、異常音を検出する教師なしの学習が含まれており、トレーニングプロセス中に通常の機械作業条件サンプルのみが利用可能である。
この2つの手法は、メルスペクトグラム処理された音響特徴を用いた密集的および畳み込み的アーキテクチャに基づくディープオートエンコーダを含む。
論文 参考訳(メタデータ) (2020-06-18T10:49:49Z) - Acoustic Anomaly Detection for Machine Sounds based on Image Transfer
Learning [8.828131257265369]
本稿では,伝達学習による音響的故障検出について考察する。
我々は、画像分類のタスクで事前訓練されたニューラルネットワークを使用する。
ResNetベースのネットワークから抽出した機能は、AlexNetやSqueezenetよりも優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-06-05T13:29:12Z) - Multi-task self-supervised learning for Robust Speech Recognition [75.11748484288229]
本稿では,雑音および残響環境下での頑健な音声認識のためのPASE+を提案する。
我々は、様々なランダムな乱れで入力信号を汚染するオンライン音声歪みモジュールを用いる。
次に,再帰型ネットワークと畳み込み型ネットワークを効率よく組み合わせて,短時間および長期の音声力学をよりよく学習する改良型エンコーダを提案する。
論文 参考訳(メタデータ) (2020-01-25T00:24:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。