論文の概要: ESTM: An Enhanced Dual-Branch Spectral-Temporal Mamba for Anomalous Sound Detection
- arxiv url: http://arxiv.org/abs/2509.02471v1
- Date: Tue, 02 Sep 2025 16:23:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:04.101046
- Title: ESTM: An Enhanced Dual-Branch Spectral-Temporal Mamba for Anomalous Sound Detection
- Title(参考訳): ESTM:異常音検出のための拡張デュアルブランチ・スペクトル・テンポラル・マンバ
- Authors: Chengyuan Ma, Peng Jia, Hongyue Guo, Wenming Yang,
- Abstract要約: 本稿では、時間周波数デカップリングモデルを用いたデュアルパス・マンバアーキテクチャに基づく新しいフレームワークESTMを提案する。
ESTMは、Melスペクトルと生音声特徴を融合させることにより、異なる時間セグメントと周波数帯域からリッチな特徴表現を抽出する。
本実験は, ESTMがDCASE 2020 Task 2データセットの異常検出性能を向上させることを示す。
- 参考スコア(独自算出の注目度): 39.234515088121086
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The core challenge in industrial equipment anoma lous sound detection (ASD) lies in modeling the time-frequency coupling characteristics of acoustic features. Existing modeling methods are limited by local receptive fields, making it difficult to capture long-range temporal patterns and cross-band dynamic coupling effects in machine acoustic features. In this paper, we propose a novel framework, ESTM, which is based on a dual-path Mamba architecture with time-frequency decoupled modeling and utilizes Selective State-Space Models (SSM) for long-range sequence modeling. ESTM extracts rich feature representations from different time segments and frequency bands by fusing enhanced Mel spectrograms and raw audio features, while further improving sensitivity to anomalous patterns through the TriStat-Gating (TSG) module. Our experiments demonstrate that ESTM improves anomalous detection performance on the DCASE 2020 Task 2 dataset, further validating the effectiveness of the proposed method.
- Abstract(参考訳): 産業機器の異常音検出(ASD)における中核的な課題は、音響特性の時間-周波数結合特性をモデル化することにある。
既存のモデリング手法は局所受容場によって制限されており、機械音響特性における長距離時間パターンとクロスバンド動的結合効果を捉えることは困難である。
本稿では、時間周波数デカップリングモデルを用いたデュアルパス・マンバアーキテクチャに基づく新しいフレームワークESTMを提案し、長距離シーケンスモデリングにSSM(Selective State-Space Models)を用いる。
ESTMは、拡張Melスペクトルと生音声特徴を融合させることにより、異なる時間セグメントと周波数帯域からリッチな特徴表現を抽出し、さらにTriStat-Gating (TSG)モジュールによる異常パターンに対する感度を向上させる。
実験により, ESTMはDCASE 2020 Task 2データセットの異常検出性能を改善し, 提案手法の有効性を検証した。
関連論文リスト
- Artificial Intelligence-Based Multiscale Temporal Modeling for Anomaly Detection in Cloud Services [10.421371572062595]
本研究では,マルチスケール特徴認識を統合したTransformerアーキテクチャに基づく異常検出手法を提案する。
提案手法は,精度,リコール,AUC,F1スコアなどの主要な指標において,主流のベースラインモデルより優れている。
論文 参考訳(メタデータ) (2025-08-20T07:52:36Z) - MR-EEGWaveNet: Multiresolutional EEGWaveNet for Seizure Detection from Long EEG Recordings [7.9595266728435545]
本稿では,背景電気グラム(EEG)アーチファクト/ノイズから発作イベントを効率よく識別する,新しいエンド・ツー・エンドモデル"MR-EEGWaveNet"を提案する。
このモデルには、畳み込み、特徴抽出、予測という3つのモジュールがある。
提案したMR-EEGWaveNetは、従来の非多重分解能アプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-05-23T14:40:50Z) - Electromyography-Based Gesture Recognition: Hierarchical Feature Extraction for Enhanced Spatial-Temporal Dynamics [0.7083699704958353]
本稿では, 時間的時間的特徴抽出手法として, 軽量な圧縮励起深層学習手法を提案する。
提案したモデルは、Ninapro DB2、DB4、DB5データセットでそれぞれ96.41%、92.40%、93.34%の精度でテストされた。
論文 参考訳(メタデータ) (2025-04-04T07:11:12Z) - FreSca: Scaling in Frequency Space Enhances Diffusion Models [55.75504192166779]
本稿では,潜時拡散モデルにおける周波数制御について検討する。
本稿では,低周波成分と高周波成分にノイズ差を分解する新しいフレームワークFreScaを紹介する。
FreScaはモデルの再トレーニングやアーキテクチャの変更なしに動作し、モデルとタスクに依存しない制御を提供する。
論文 参考訳(メタデータ) (2025-04-02T22:03:11Z) - Multimodal Attention-Enhanced Feature Fusion-based Weekly Supervised Anomaly Violence Detection [1.9223495770071632]
このシステムは、RGBビデオ、光フロー、オーディオ信号の3つの特徴ストリームを使用し、それぞれのストリームが相補的な空間的特徴と時間的特徴を抽出する。
このシステムは3つのデータセットの異常検出精度とロバスト性を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-17T14:17:52Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。