論文の概要: An Enhanced Audio Feature Tailored for Anomalous Sound Detection Based on Pre-trained Models
- arxiv url: http://arxiv.org/abs/2508.15334v1
- Date: Thu, 21 Aug 2025 08:04:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.232077
- Title: An Enhanced Audio Feature Tailored for Anomalous Sound Detection Based on Pre-trained Models
- Title(参考訳): 事前学習モデルに基づく異常音検出のための高機能化
- Authors: Guirui Zhong, Qing Wang, Jun Du, Lei Wang, Mingqi Cai, Xin Fang,
- Abstract要約: Anomalous Sound Detection (ASD) は、機械から異常音を特定することを目的としている。
異常位置の不確かさと機械音のノイズなどの余分な情報により、ASDシステムの性能が向上する。
本稿では,各周波数帯に対して等間隔に分散したフィルタバンクを用いた新しい音声特徴量を提案する。
- 参考スコア(独自算出の注目度): 34.59032968400701
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Anomalous Sound Detection (ASD) aims at identifying anomalous sounds from machines and has gained extensive research interests from both academia and industry. However, the uncertainty of anomaly location and much redundant information such as noise in machine sounds hinder the improvement of ASD system performance. This paper proposes a novel audio feature of filter banks with evenly distributed intervals, ensuring equal attention to all frequency ranges in the audio, which enhances the detection of anomalies in machine sounds. Moreover, based on pre-trained models, this paper presents a parameter-free feature enhancement approach to remove redundant information in machine audio. It is believed that this parameter-free strategy facilitates the effective transfer of universal knowledge from pre-trained tasks to the ASD task during model fine-tuning. Evaluation results on the Detection and Classification of Acoustic Scenes and Events (DCASE) 2024 Challenge dataset demonstrate significant improvements in ASD performance with our proposed methods.
- Abstract(参考訳): 異常音検出(ASD)は、機械から異常音を特定することを目的としており、学術と産業の両方から幅広い研究の関心を集めている。
しかし、異常位置の不確実性や機械音のノイズなどの余分な情報により、ASDシステムの性能が向上する。
本稿では, 等間隔に分散したフィルタバンクの音響特性を新たに提案し, 機械音の異常検出を向上する。
さらに,事前学習モデルに基づくパラメータフリーな特徴強調手法を提案する。
このパラメータフリー戦略は、モデル微調整中に事前訓練されたタスクからALDタスクへの普遍的な知識の効果的な伝達を促進すると考えられている。
音響シーン・イベント(DCASE)2024チャレンジデータセットの検出・分類結果から,提案手法によるASD性能の大幅な向上が示された。
関連論文リスト
- MIMII-Agent: Leveraging LLMs with Function Calling for Relative Evaluation of Anomalous Sound Detection [5.578413517654703]
本研究では, 教師なし音響検出システムの相対性能を評価するために, 機械種別異常を生成する手法を提案する。
大規模言語モデル(LLM)を用いて,故障のテキスト記述を解釈し,音声変換機能を自動的に選択する。
論文 参考訳(メタデータ) (2025-07-28T09:42:41Z) - Exploring the Frontiers of kNN Noisy Feature Detection and Recovery for Self-Driving Labs [0.49478969093606673]
本研究では,ノイズのある特徴を自動で検出し,修正可能なサンプル・フィーチャー・ペアリングを判定し,最終的に適切な特徴値を復元するワークフローを開発する。
次に, データセットのサイズ, 雑音強度, 特徴値分布が, ノイズの特徴の検出可能性および回復可能性に与える影響について, 系統的研究を行った。
論文 参考訳(メタデータ) (2025-07-15T03:35:56Z) - Towards Robust Transcription: Exploring Noise Injection Strategies for Training Data Augmentation [55.752737615873464]
本研究では,SNR(Signal-to-Noise Ratio)レベルにおける白色雑音の影響について検討した。
この研究は、様々な音環境における一貫した性能を維持する転写モデルの開発に向けた予備的な研究として、貴重な洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2024-10-18T02:31:36Z) - ASD-Diffusion: Anomalous Sound Detection with Diffusion Models [6.659078422704148]
実世界の工場において, 拡散モデル(ASD-Diffusion)に基づく異常音検出法が提案されている。
再構成後の入力から大きくずれた異常を検出するために, 後処理異常フィルタアルゴリズムを提案する。
暗黙的拡散モデルを導入し、推論速度を高速化する。
論文 参考訳(メタデータ) (2024-09-24T10:42:23Z) - Improving Anomalous Sound Detection via Low-Rank Adaptation Fine-Tuning of Pre-Trained Audio Models [45.90037602677841]
本稿では,音声事前学習モデルを利用した頑健なAnomalous Sound Detection (ASD)モデルを提案する。
マシン操作データを用いてこれらのモデルを微調整し、データ拡張戦略としてSpecAugを使用します。
実験では,従来のSOTAモデルと比較して6.48%の大幅な改善が得られた。
論文 参考訳(メタデータ) (2024-09-11T05:19:38Z) - Anomalous Sound Detection using Audio Representation with Machine ID
based Contrastive Learning Pretraining [52.191658157204856]
コントラスト学習を用いて、各音声サンプルではなく、各機械IDの音声表現を洗練する。
提案手法では、コントラスト学習を用いて音声表現モデルを事前学習する。
実験の結果,本手法はコントラスト学習や自己教師型分類を用いて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-07T11:08:31Z) - Improving the Robustness of Summarization Models by Detecting and
Removing Input Noise [50.27105057899601]
本研究では,様々な種類の入力ノイズから,様々なデータセットやモデルサイズに対する性能損失を定量化する大規模な実験的検討を行った。
本稿では,モデル推論中の入力中のそのようなノイズを検出し,除去するための軽量な手法を提案する。
論文 参考訳(メタデータ) (2022-12-20T00:33:11Z) - Inference and Denoise: Causal Inference-based Neural Speech Enhancement [83.4641575757706]
本研究では、雑音の存在を介入としてモデル化することにより、因果推論パラダイムにおける音声強調(SE)課題に対処する。
提案した因果推論に基づく音声強調(CISE)は,ノイズ検出器を用いて間欠雑音音声中のクリーンフレームとノイズフレームを分離し,両フレームセットを2つのマスクベース拡張モジュール(EM)に割り当て,ノイズ条件SEを実行する。
論文 参考訳(メタデータ) (2022-11-02T15:03:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。