論文の概要: Sub-Band Spectral Matching with Localized Score Aggregation for Robust Anomalous Sound Detection
- arxiv url: http://arxiv.org/abs/2603.13749v1
- Date: Sat, 14 Mar 2026 04:38:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.381498
- Title: Sub-Band Spectral Matching with Localized Score Aggregation for Robust Anomalous Sound Detection
- Title(参考訳): ロバスト異常音検出のための局所スコアアグリゲーションを用いたサブバンドスペクトルマッチング
- Authors: Phurich Saengthong, Takahiro Shinozaki,
- Abstract要約: 一般的な訓練不要な異常音検出パイプラインは、フレームレベルの表現をバンド保存特徴ベクトルに時間的にプールし、異常をスコアする。
1つのグローバルな隣人はすべてのバンドに同じ基準を共有するよう強制し、バンドレベルのミスマッチが増加する。
本稿では,時間的にプールされたサブバンドベクトルをメモリバンクに格納し,サブバンド毎の隣人を検索し,スコアを均一に集約して正規スコアの変動を低減し,識別性を向上させるBEAMを提案する。
- 参考スコア(独自算出の注目度): 11.328862535847785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting subtle deviations in noisy acoustic environments is central to anomalous sound detection (ASD). A common training-free ASD pipeline temporally pools frame-level representations into a band-preserving feature vector and scores anomalies using a single nearest-neighbor match. However, this global matching can inflate normal-score variance through two effects. First, when normal sounds exhibit band-wise variability, a single global neighbor forces all bands to share the same reference, increasing band-level mismatch. Second, cosine-based matching is energy-coupled, allowing a few high-energy bands to dominate score computation under normal energy fluctuations and further increase variance. We propose BEAM, which stores temporally pooled sub-band vectors in a memory bank, retrieves neighbors per sub-band, and uniformly aggregates scores to reduce normal-score variability and improve discriminability. We further introduce a parameter-free adaptive fusion to better handle diverse temporal dynamics in sub-band responses. Experiments on multiple DCASE Task 2 benchmarks show strong performance without task-specific training, robustness to noise and domain shifts, and complementary gains when combined with encoder fine-tuning.
- Abstract(参考訳): 雑音音環境における微妙な偏差の検出は、異常音検出(ASD)の中心となる。
トレーニング不要の一般的なASDパイプラインは、フレームレベルの表現を時間的にバンド保存特徴ベクトルにプールし、隣接する1つのマッチを使用して異常をスコアする。
しかし、この大域的マッチングは2つの効果を通じて正規スコアの分散を増大させることができる。
まず、通常の音が帯域幅の変動を示すとき、一つのグローバルな隣人はすべてのバンドに同じ基準を共有させ、バンドレベルのミスマッチを増大させる。
第二に、コサインベースのマッチングはエネルギー結合であり、いくつかの高エネルギーバンドが通常のエネルギー変動の下でスコア計算を支配し、さらに分散を増加させることができる。
本稿では,時間的にプールされたサブバンドベクトルをメモリバンクに格納し,サブバンド毎の隣人を検索し,スコアを均一に集約して正規スコアの変動を低減し,識別性を向上させるBEAMを提案する。
さらに,パラメータフリー適応核融合を導入し,サブバンド応答における時間的ダイナミクスをよりよく扱う。
複数のDCASE Task 2ベンチマークの実験では、タスク固有のトレーニング、ノイズやドメインシフトに対する堅牢性、エンコーダの微調整と組み合わせた場合の相補的ゲインがない。
関連論文リスト
- Test-time Adaptive Hierarchical Co-enhanced Denoising Network for Reliable Multimodal Classification [55.56234913868664]
マルチモーダルデータを用いた信頼性学習のためのTAHCD(Test-time Adaptive Hierarchical Co-enhanced Denoising Network)を提案する。
提案手法は,最先端の信頼性の高いマルチモーダル学習手法と比較して,優れた分類性能,堅牢性,一般化を実現する。
論文 参考訳(メタデータ) (2026-01-12T03:14:12Z) - Control Variate Score Matching for Diffusion Models [34.30408848157335]
雑音スペクトル全体の分散最小化を理論的に保証する最適時間依存制御係数を導出したCVSIを導入する。
CVSIは,データフリーサンプリング学習と推論時間拡散サンプリングの両方において,サンプル効率を大幅に向上させる,堅牢で低分散なプラグイン推定器として機能することが実証された。
論文 参考訳(メタデータ) (2025-12-23T02:55:14Z) - Interaction as Interference: A Quantum-Inspired Aggregation Approach [4.07636450847048]
我々は、相互作用を、エンジニアリングされた製品用語として、あるいは柔軟なモデルにおける創発的なパターンとして、量子的に着想を得たビューと捉えています。
最小線形振幅モデルでは、この交差項は因子設計における標準電位-出力相互作用コントラスト(_mathrmINT)と等しい。
我々はこのアイデアを軽量なemphInterference Kernel (IKC) にインスタンス化し、emphCoherent Gain (非一貫性プロキシよりもコヒーレントをlog-likelihood gain of coherent)とemphInterという2つの診断手法を導入する。
論文 参考訳(メタデータ) (2025-11-13T06:44:18Z) - Certified Adversarial Robustness Within Multiple Perturbation Bounds [38.3813286696956]
ランダムスムーシング(Randomized smoothing、RS)は、敵の攻撃に対するよく知られた防御である。
本研究では,複数の摂動境界に対して同時に認証された対向ロバスト性を改善することを目的としている。
論文 参考訳(メタデータ) (2023-04-20T16:42:44Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - A Sub-band Approach to Deep Denoising Wavelet Networks and a
Frequency-adaptive Loss for Perceptual Quality [0.0]
ニューラルネットワークでDWTを使用するアプローチは、精度を顕著に向上することを示す。
第2の貢献は、周波数領域のエラーの上位kパーセントに基づくノイズ損失です。
論文 参考訳(メタデータ) (2021-02-16T06:35:42Z) - Consensus-Guided Correspondence Denoising [67.35345850146393]
本稿では,地域間コンセンサス学習フレームワークと対応関係を異色化し,対応関係をロバストに識別する。
ローカル地域からグローバル地域への動的グラフから推定されるコンセンサススコアに基づいて,信頼度の高い候補を初期マッチングから蒸留する新しい「プルーニング」ブロックを導入した。
本手法は、堅牢なラインフィッティング、ワイドベースライン画像マッチング、画像ローカリゼーションベンチマークを顕著なマージンで上回る。
論文 参考訳(メタデータ) (2021-01-03T09:10:00Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。