論文の概要: From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms
- arxiv url: http://arxiv.org/abs/2502.18328v1
- Date: Tue, 25 Feb 2025 16:22:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-26 15:19:12.858208
- Title: From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms
- Title(参考訳): 視覚から音へ:視覚に基づくアルゴリズムによるオーディオ異常検出の改善
- Authors: Manuel Barusco, Francesco Borsatti, Davide Dalle Pezze, Francesco Paissan, Elisabetta Farella, Gian Antonio Susto,
- Abstract要約: 我々は、オーディオ異常検出(AAD)の問題に対処するために、そのようなアルゴリズムのオーディオ領域への適応について検討する。
主に異常サンプルを分類する既存のAAD法とは異なり,本手法ではスペクトル内における異常の微細な時間周波数局在を導入している。
本研究では,産業用および環境用ベンチマークに対するアプローチを評価し,音声信号の異常検出におけるVAD手法の有効性を実証した。
- 参考スコア(独自算出の注目度): 6.643376250301589
- License:
- Abstract: Recent advances in Visual Anomaly Detection (VAD) have introduced sophisticated algorithms leveraging embeddings generated by pre-trained feature extractors. Inspired by these developments, we investigate the adaptation of such algorithms to the audio domain to address the problem of Audio Anomaly Detection (AAD). Unlike most existing AAD methods, which primarily classify anomalous samples, our approach introduces fine-grained temporal-frequency localization of anomalies within the spectrogram, significantly improving explainability. This capability enables a more precise understanding of where and when anomalies occur, making the results more actionable for end users. We evaluate our approach on industrial and environmental benchmarks, demonstrating the effectiveness of VAD techniques in detecting anomalies in audio signals. Moreover, they improve explainability by enabling localized anomaly identification, making audio anomaly detection systems more interpretable and practical.
- Abstract(参考訳): 視覚異常検出(VAD)の最近の進歩は、事前訓練された特徴抽出器によって生成された埋め込みを利用した高度なアルゴリズムを導入している。
これらの発展に触発されて,音響異常検出(AAD)の問題に対処するために,そのようなアルゴリズムをオーディオ領域に適応させる方法について検討する。
主に異常サンプルを分類する既存のAAD法とは異なり,本手法ではスペクトル内の異常の微細な時間周波数局在を導入し,説明可能性を大幅に向上する。
この能力により、異常が発生した場所とタイミングをより正確に理解することができ、結果がエンドユーザにとってより実用的なものになる。
本研究では,産業用および環境用ベンチマークに対するアプローチを評価し,音声信号の異常検出におけるVAD手法の有効性を実証した。
さらに、局所的な異常識別を可能にし、音声異常検出システムをより解釈し、実用的なものにすることで、説明可能性を向上させる。
関連論文リスト
- Unsupervised Anomaly Detection Using Diffusion Trend Analysis [48.19821513256158]
本稿では, 劣化度に応じて, 復元傾向の分析により異常を検出する手法を提案する。
提案手法は,産業用異常検出のためのオープンデータセット上で検証される。
論文 参考訳(メタデータ) (2024-07-12T01:50:07Z) - ATAC-Net: Zoomed view works better for Anomaly Detection [1.024113475677323]
ATAC-Netは、既知の最小限の事前異常から異常を検出する訓練を行うフレームワークである。
我々は、その優位性を、同等の設定で現在の最先端技術と比較する。
論文 参考訳(メタデータ) (2024-06-20T15:18:32Z) - What to Remember: Self-Adaptive Continual Learning for Audio Deepfake
Detection [53.063161380423715]
既存の検出モデルは、既知のディープフェイク音声を識別することに成功したが、新しい攻撃タイプに遭遇する際には苦労している。
本稿では,Radian Weight Modification (RWM) と呼ばれる連続的な学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-15T09:52:17Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - Adaptive Fake Audio Detection with Low-Rank Model Squeezing [50.7916414913962]
ファインタニングのような従来の手法は計算集約的であり、既知の偽音声タイプの知識を損なう危険性がある。
本稿では,新たに登場したニセモノ音声タイプに特化して,低ランク適応行列をトレーニングするコンセプトを紹介する。
当社のアプローチには,ストレージメモリ要件の削減やエラー率の低下など,いくつかのメリットがあります。
論文 参考訳(メタデータ) (2023-06-08T06:06:42Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Framing Algorithmic Recourse for Anomaly Detection [18.347886926848563]
我々は,タブラルデータ(CARAT)における異常に対する文脈保存型アルゴリズムレコースを提案する。
CARATはトランスフォーマーベースのエンコーダデコーダモデルを用いて、低い確率で特徴を見つけることで異常を説明する。
異常なインスタンス内の特徴の全体的コンテキストを使用して、強調された特徴を変更することによって、意味的に一貫性のある反事実が生成される。
論文 参考訳(メタデータ) (2022-06-29T03:30:51Z) - Canonical Polyadic Decomposition and Deep Learning for Machine Fault
Detection [0.0]
マシンからあらゆる種類の障害を学ぶのに十分なデータを集めることは不可能である。
健康状態のみのデータを用いてトレーニングされた新しいアルゴリズムを開発し、教師なしの異常検出を行った。
これらのアルゴリズムの開発における重要な問題は、異常検出性能に影響を与える信号のノイズである。
論文 参考訳(メタデータ) (2021-07-20T14:06:50Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Identifying Audio Adversarial Examples via Anomalous Pattern Detection [4.556497931273283]
音声処理システムに対する最近の敵攻撃の2つが、一部のノードにおいて、予測以上のアクティベーションをもたらすことを示す。
我々はこれらの攻撃を、良性サンプルの性能を低下させることなく、最大0.98のAUCで検出することができる。
論文 参考訳(メタデータ) (2020-02-13T12:08:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。