論文の概要: Anomalous Sound Detection using unsupervised and semi-supervised
autoencoders and gammatone audio representation
- arxiv url: http://arxiv.org/abs/2006.15321v1
- Date: Sat, 27 Jun 2020 08:25:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 08:17:01.539389
- Title: Anomalous Sound Detection using unsupervised and semi-supervised
autoencoders and gammatone audio representation
- Title(参考訳): 教師なし・半教師付きオートエンコーダとガンマトン音響表現を用いた異常音検出
- Authors: Sergi Perez-Castanos, Javier Naranjo-Alcazar, Pedro Zuccarello and
Maximo Cobos
- Abstract要約: 本稿では,畳み込みオートエンコーダとガンマトーンに基づく音声表現に基づく新しいフレームワークを提案する。
機械の故障や損傷を早期に検出することは、大きな節約と産業プロセスの効率の向上を意味する可能性がある。
- 参考スコア(独自算出の注目度): 4.591851728010269
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomalous sound detection (ASD) is, nowadays, one of the topical subjects in
machine listening discipline. Unsupervised detection is attracting a lot of
interest due to its immediate applicability in many fields. For example,
related to industrial processes, the early detection of malfunctions or damage
in machines can mean great savings and an improvement in the efficiency of
industrial processes. This problem can be solved with an unsupervised ASD
solution since industrial machines will not be damaged simply by having this
audio data in the training stage. This paper proposes a novel framework based
on convolutional autoencoders (both unsupervised and semi-supervised) and a
Gammatone-based representation of the audio. The results obtained by these
architectures substantially exceed the results presented as a baseline.
- Abstract(参考訳): 異常音検出(ASD)は近年,機械聴取分野における話題の一つとなっている。
教師なし検出は、多くの分野ですぐに適用できるため、多くの関心を集めている。
例えば、産業プロセスに関連して、機械の故障や損傷を早期に検出することは、大きな節約と産業プロセスの効率の向上を意味する。
この問題は、このオーディオデータをトレーニング段階で持つだけでは産業機械が損傷を受けないため、教師なしのSDソリューションで解決できる。
本稿では,畳み込み型オートエンコーダ(教師なしと半教師付きの両方)とガンマトンに基づく音声表現に基づく新しいフレームワークを提案する。
これらのアーキテクチャによって得られた結果は、ベースラインとして提示された結果を大幅に上回る。
関連論文リスト
- Activity-Guided Industrial Anomalous Sound Detection against Interferences [8.864726245462908]
ソース分離(SS)と異常検出(AD)のフレームワークであるSSADを提案する。
SSADは、(i)アクティビティインフォームドSS、(i)アクティビティインフォームドSS、(ii)2ステップマスキング、および(ii)マシンアクティビティに沿った異常を強調して異常検出を堅牢化する2つのコンポーネントから構成される。
実験により,SSADはクリーン信号に完全アクセス可能なベースラインに匹敵する精度を達成し,SSADは劣化信号と活動情報のみを提供することを示した。
論文 参考訳(メタデータ) (2024-09-03T13:26:25Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - SoftPatch: Unsupervised Anomaly Detection with Noisy Data [67.38948127630644]
本稿では,画像センサ異常検出におけるラベルレベルのノイズを初めて考察する。
本稿では,メモリベースの非教師付きAD手法であるSoftPatchを提案する。
既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。
論文 参考訳(メタデータ) (2024-03-21T08:49:34Z) - Acoustic Signal Analysis with Deep Neural Network for Detecting Fault
Diagnosis in Industrial Machines [0.0]
本研究では,産業機械が生み出す音声信号を分析するための深層学習システムについて検討した。
提案手法の精度は97.17%から99.87%まで変化した。
論文 参考訳(メタデータ) (2023-12-02T08:09:27Z) - Unsupervised Anomaly Detection and Localization of Machine Audio: A
GAN-based Approach [17.85309428707623]
AEGAN-ADは、入力スペクトログラムを再構成するためにジェネレータを訓練する全く教師なしのアプローチである。
DCASE 2022 Challenge TASK 2のデータセット上でのAEGAN-ADの性能は、最先端の結果を示している。
論文 参考訳(メタデータ) (2023-03-31T10:27:36Z) - Deepfake audio detection by speaker verification [79.99653758293277]
本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。
提案手法は,既成話者検証ツールに基づいて実装することができる。
そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
論文 参考訳(メタデータ) (2022-09-28T13:46:29Z) - Should All Proposals be Treated Equally in Object Detection? [110.27485090952385]
オブジェクト検出器の複雑さと精度のトレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。
検出効率の改善には、提案の不平等な処理に向けて、パラダイムシフトが必要であると仮定されている。
これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
論文 参考訳(メタデータ) (2022-07-07T18:26:32Z) - Canonical Polyadic Decomposition and Deep Learning for Machine Fault
Detection [0.0]
マシンからあらゆる種類の障害を学ぶのに十分なデータを集めることは不可能である。
健康状態のみのデータを用いてトレーニングされた新しいアルゴリズムを開発し、教師なしの異常検出を行った。
これらのアルゴリズムの開発における重要な問題は、異常検出性能に影響を与える信号のノイズである。
論文 参考訳(メタデータ) (2021-07-20T14:06:50Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。
ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文 参考訳(メタデータ) (2021-03-08T10:56:38Z) - Acoustic Anomaly Detection for Machine Sounds based on Image Transfer
Learning [8.828131257265369]
本稿では,伝達学習による音響的故障検出について考察する。
我々は、画像分類のタスクで事前訓練されたニューラルネットワークを使用する。
ResNetベースのネットワークから抽出した機能は、AlexNetやSqueezenetよりも優れた結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-06-05T13:29:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。