論文の概要: Noise Supervised Contrastive Learning and Feature-Perturbed for Anomalous Sound Detection
- arxiv url: http://arxiv.org/abs/2509.13853v2
- Date: Thu, 18 Sep 2025 05:34:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 13:12:58.953369
- Title: Noise Supervised Contrastive Learning and Feature-Perturbed for Anomalous Sound Detection
- Title(参考訳): 異音検出のためのコントラスト学習と特徴性能の監視
- Authors: Shun Huang, Zhihua Fang, Liang He,
- Abstract要約: 教師なし異常音検出は,正常な音声データのみを用いてモデルを訓練することにより未知の異常音を検出することを目的としている。
本稿では,一段階教師付きコントラスト学習(OS-SCL)と呼ばれる新しい学習手法を提案する。
OS-SCLは、埋め込み空間の機能を摂動させ、一段階のノイズ制御型コントラスト学習アプローチを採用することでこの問題に対処する。
- 参考スコア(独自算出の注目度): 10.819628019542618
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Unsupervised anomalous sound detection aims to detect unknown anomalous sounds by training a model using only normal audio data. Despite advancements in self-supervised methods, the issue of frequent false alarms when handling samples of the same type from different machines remains unresolved. This paper introduces a novel training technique called one-stage supervised contrastive learning (OS-SCL), which significantly addresses this problem by perturbing features in the embedding space and employing a one-stage noisy supervised contrastive learning approach. On the DCASE 2020 Challenge Task 2, it achieved 94.64\% AUC, 88.42\% pAUC, and 89.24\% mAUC using only Log-Mel features. Additionally, a time-frequency feature named TFgram is proposed, which is extracted from raw audio. This feature effectively captures critical information for anomalous sound detection, ultimately achieving 95.71\% AUC, 90.23\% pAUC, and 91.23\% mAUC. The source code is available at: \underline{www.github.com/huangswt/OS-SCL}.
- Abstract(参考訳): 教師なし異常音検出は,正常な音声データのみを用いてモデルを訓練することにより未知の異常音を検出することを目的としている。
自己監視手法の進歩にもかかわらず、異なるマシンから同じタイプのサンプルを扱う場合の頻繁な誤報の問題は未解決のままである。
本稿では,1段階教師付きコントラスト学習(OS-SCL)と呼ばれる新しい学習手法を提案する。
DCASE 2020 Challenge Task 2では94.64\% AUC、88.42\% pAUC、89.24\% mAUCを達成した。
また、生音声から抽出したTFgramという時間周波数特徴も提案する。
この機能は、異常な音の検出のための重要な情報を効果的にキャプチャし、最終的に95.71 % AUC、90.23 % pAUC、91.23 % mAUCを達成した。
ソースコードは: \underline{www.github.com/huangswt/OS-SCL}で入手できる。
関連論文リスト
- Distributed collaborative anomalous sound detection by embedding sharing [4.327763441385372]
本稿では,複数のクライアントが協調して異常音検出モデルを学習する手法について検討する。
提案手法では,各クライアントが音響データ分類のために開発した共通事前学習モデルを用いて埋め込みを計算する。
実験の結果,提案手法は異常音検出のAUCを平均6.8%改善することがわかった。
論文 参考訳(メタデータ) (2024-03-25T10:40:04Z) - SoftPatch: Unsupervised Anomaly Detection with Noisy Data [67.38948127630644]
本稿では,画像センサ異常検出におけるラベルレベルのノイズを初めて考察する。
本稿では,メモリベースの非教師付きAD手法であるSoftPatchを提案する。
既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。
論文 参考訳(メタデータ) (2024-03-21T08:49:34Z) - Anomalous Sound Detection using Audio Representation with Machine ID
based Contrastive Learning Pretraining [52.191658157204856]
コントラスト学習を用いて、各音声サンプルではなく、各機械IDの音声表現を洗練する。
提案手法では、コントラスト学習を用いて音声表現モデルを事前学習する。
実験の結果,本手法はコントラスト学習や自己教師型分類を用いて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-07T11:08:31Z) - Robust Semi-Supervised Anomaly Detection via Adversarially Learned
Continuous Noise Corruption [11.135527192198092]
異常検出は、予め確立された正常性から著しく逸脱した新しいサンプルを認識するタスクである。
ディープオートエンコーダ(AE)は、異常検出タスクとして広く使用されているが、ヌルID関数への過度な適合に悩まされている。
本稿では,適応学習連続雑音(ALCN)を効率よく生成する手法を提案する。
論文 参考訳(メタデータ) (2023-03-02T22:59:20Z) - Canonical Polyadic Decomposition and Deep Learning for Machine Fault
Detection [0.0]
マシンからあらゆる種類の障害を学ぶのに十分なデータを集めることは不可能である。
健康状態のみのデータを用いてトレーニングされた新しいアルゴリズムを開発し、教師なしの異常検出を行った。
これらのアルゴリズムの開発における重要な問題は、異常検出性能に影響を与える信号のノイズである。
論文 参考訳(メタデータ) (2021-07-20T14:06:50Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z) - Learning based signal detection for MIMO systems with unknown noise
statistics [84.02122699723536]
本論文では,未知のノイズ統計による信号を堅牢に検出する一般化最大確率(ML)推定器を考案する。
実際には、システムノイズに関する統計的な知識はほとんどなく、場合によっては非ガウス的であり、衝動的であり、分析不可能である。
我々のフレームワークは、ノイズサンプルのみを必要とする教師なしの学習アプローチによって駆動される。
論文 参考訳(メタデータ) (2021-01-21T04:48:15Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。