論文の概要: A Framework for Evaluating Faithfulness in Explainable AI for Machine Anomalous Sound Detection Using Frequency-Band Perturbation
- arxiv url: http://arxiv.org/abs/2601.19017v1
- Date: Mon, 26 Jan 2026 23:06:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.09164
- Title: A Framework for Evaluating Faithfulness in Explainable AI for Machine Anomalous Sound Detection Using Frequency-Band Perturbation
- Title(参考訳): 周波数帯域摂動を用いた機械異常音検出のための説明可能なAIの忠実度評価フレームワーク
- Authors: Alexander Buck, Georgina Cosma, Iain Phillips, Paul Conway, Patrick Baker,
- Abstract要約: 機械音響解析におけるXAI忠実度を評価するための新しい定量的枠組みを提案する。
我々は,XAI技術が信頼性に違いがあることを示し,Occlusionは真のモデル感度と最強のアライメントを示す。
- 参考スコア(独自算出の注目度): 37.2521660642532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Explainable AI (XAI) is commonly applied to anomalous sound detection (ASD) models to identify which time-frequency regions of an audio signal contribute to an anomaly decision. However, most audio explanations rely on qualitative inspection of saliency maps, leaving open the question of whether these attributions accurately reflect the spectral cues the model uses. In this work, we introduce a new quantitative framework for evaluating XAI faithfulness in machine-sound analysis by directly linking attribution relevance to model behaviour through systematic frequency-band removal. This approach provides an objective measure of whether an XAI method for machine ASD correctly identifies frequency regions that influence an ASD model's predictions. By using four widely adopted methods, namely Integrated Gradients, Occlusion, Grad-CAM and SmoothGrad, we show that XAI techniques differ in reliability, with Occlusion demonstrating the strongest alignment with true model sensitivity and gradient-+based methods often failing to accurately capture spectral dependencies. The proposed framework offers a reproducible way to benchmark audio explanations and enables more trustworthy interpretation of spectrogram-based ASD systems.
- Abstract(参考訳): 説明可能なAI(XAI)は、異常音検出(ASD)モデルに適用され、音声信号のどの時間周波数領域が異常判定に寄与するかを特定する。
しかし、ほとんどの音声説明は、サージエンシマップの質的な検査に依存しており、これらの属性がモデルが使用するスペクトルキューを正確に反映しているかどうかという疑問が残る。
本研究では,機械音響解析におけるXAI忠実度を評価するための新しい定量的枠組みを提案する。
このアプローチは、マシンASDのXAI手法が、ASDモデルの予測に影響を与える周波数領域を正しく識別するかどうかを客観的に測定する。
一般に広く採用されている4つの手法、すなわちIntegrated Gradients, Occlusion, Grad-CAM, SmoothGradを用いて、XAI技術は信頼性が異なることを示した。
提案フレームワークは、音声説明のベンチマークを行う再現可能な方法を提供し、分光器ベースのASDシステムのより信頼性の高い解釈を可能にする。
関連論文リスト
- Unveiling Perceptual Artifacts: A Fine-Grained Benchmark for Interpretable AI-Generated Image Detection [95.08316274158165]
X-AIGDは、低レベルの歪み、高レベルの意味論、認知レベルの反事実など、知覚的アーティファクトのピクセルレベルの分類されたアノテーションを提供する。
既存のAIGI検出器は、最も基本的な歪みレベルであっても、知覚的アーティファクトに依存しない。
モデル注意をアーティファクト領域と明確に整合させることは、検出器の解釈可能性と一般化を高めることができる。
論文 参考訳(メタデータ) (2026-01-27T10:09:17Z) - Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application [11.385703484113552]
生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
意味的特徴抽出のための変分オートエンコーダを組み合わせた潜在拡散モデル(LDM)に基づくセマンティックコミュニケーションフレームワークを提案する。
提案システムはゼロショットの一般化をサポートし,低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現する訓練自由フレームワークである。
論文 参考訳(メタデータ) (2025-06-06T03:20:32Z) - Unified AI for Accurate Audio Anomaly Detection [0.0]
本稿では,高精度な音声異常検出のための統合AIフレームワークを提案する。
高度なノイズ低減、特徴抽出、機械学習モデリング技術を統合する。
このフレームワークはTORGOやLibriSpeechといったベンチマークデータセットで評価されている。
論文 参考訳(メタデータ) (2025-05-20T16:56:08Z) - FADEL: Uncertainty-aware Fake Audio Detection with Evidential Deep Learning [9.960675988638805]
顕在学習を用いた偽音声検出(FADEL)という新しいフレームワークを提案する。
FADELはモデルの不確実性を予測に組み込んでおり、OODシナリオではより堅牢なパフォーマンスを実現している。
本研究では,異なるスプーフィングアルゴリズム間の平均不確かさと等誤差率(EER)の強い相関関係を解析し,不確かさ推定の有効性を示す。
論文 参考訳(メタデータ) (2025-04-22T07:40:35Z) - From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms [6.643376250301589]
我々は、オーディオ異常検出(AAD)の問題に対処するために、そのようなアルゴリズムのオーディオ領域への適応について検討する。
主に異常サンプルを分類する既存のAAD法とは異なり,本手法ではスペクトル内における異常の微細な時間周波数局在を導入している。
本研究では,産業用および環境用ベンチマークに対するアプローチを評価し,音声信号の異常検出におけるVAD手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-02-25T16:22:42Z) - What Does an Audio Deepfake Detector Focus on? A Study in the Time Domain [4.8975242634878295]
本稿では, 関連性に基づく説明可能なAI(XAI)手法を提案する。
我々は、限られた発話のみを研究する従来の研究とは異なり、大規模なデータセットを考慮に入れている。
音声・非音声・音声・音声・オフセットの相対的重要性に関するさらなる調査は、大きなデータセットで評価すると、限られた発話の分析から得られたXAI結果が必ずしも保持されないことを示唆している。
論文 参考訳(メタデータ) (2025-01-23T18:00:14Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - The role of noise in denoising models for anomaly detection in medical
images [62.0532151156057]
病理脳病変は脳画像に多彩な外観を示す。
正規データのみを用いた教師なし異常検出手法が提案されている。
空間分解能の最適化と雑音の大きさの最適化により,異なるモデル学習体制の性能が向上することを示す。
論文 参考訳(メタデータ) (2023-01-19T21:39:38Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。