論文の概要: Machine Anomalous Sound Detection Using Spectral-temporal Modulation Representations Derived from Machine-specific Filterbanks
- arxiv url: http://arxiv.org/abs/2409.05319v1
- Date: Mon, 9 Sep 2024 04:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-10 15:50:59.592044
- Title: Machine Anomalous Sound Detection Using Spectral-temporal Modulation Representations Derived from Machine-specific Filterbanks
- Title(参考訳): 機械固有フィルタバンクからのスペクトル時間変調表現を用いた機械異常音検出
- Authors: Kai Li, Khalid Zaman, Xingfeng Li, Masato Akagi, Masashi Unoki,
- Abstract要約: 工場機械の故障の早期発見は産業応用において重要である。
機械異常音検出(ASD)では、異なる機械はその物理特性に基づいて独自の振動周波数範囲を示す。
人間の聴覚システムは、機械音の時間的およびスペクトル的ダイナミクスの追跡に適している。
- 参考スコア(独自算出の注目度): 14.011206544127887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early detection of factory machinery malfunctions is crucial in industrial applications. In machine anomalous sound detection (ASD), different machines exhibit unique vibration-frequency ranges based on their physical properties. Meanwhile, the human auditory system is adept at tracking both temporal and spectral dynamics of machine sounds. Consequently, integrating the computational auditory models of the human auditory system with machine-specific properties can be an effective approach to machine ASD. We first quantified the frequency importances of four types of machines using the Fisher ratio (F-ratio). The quantified frequency importances were then used to design machine-specific non-uniform filterbanks (NUFBs), which extract the log non-uniform spectrum (LNS) feature. The designed NUFBs have a narrower bandwidth and higher filter distribution density in frequency regions with relatively high F-ratios. Finally, spectral and temporal modulation representations derived from the LNS feature were proposed. These proposed LNS feature and modulation representations are input into an autoencoder neural-network-based detector for ASD. The quantification results from the training set of the Malfunctioning Industrial Machine Investigation and Inspection dataset with a signal-to-noise (SNR) of 6 dB reveal that the distinguishing information between normal and anomalous sounds of different machines is encoded non-uniformly in the frequency domain. By highlighting these important frequency regions using NUFBs, the LNS feature can significantly enhance performance using the metric of AUC (area under the receiver operating characteristic curve) under various SNR conditions. Furthermore, modulation representations can further improve performance. Specifically, temporal modulation is effective for fans, pumps, and sliders, while spectral modulation is particularly effective for valves.
- Abstract(参考訳): 工場機械の故障の早期発見は産業応用において重要である。
機械異常音検出(ASD)では、異なる機械はその物理特性に基づいて独自の振動周波数範囲を示す。
一方、人間の聴覚システムは、機械音の時間的・スペクトル的ダイナミクスの追跡に長けている。
したがって、人間の聴覚システムの計算聴覚モデルと機械固有の特性を統合することは、マシンASDに対する効果的なアプローチである。
まず,フィッシャー比(F比)を用いて4種類の機械の周波数重要度を定量化した。
量子化された周波数の重要度は、機械固有の非一様フィルタバンク(NUFB)の設計に使われ、ログ非一様スペクトル(LNS)の特徴を抽出した。
設計されたNUFBは、F比が比較的高い周波数領域において、帯域幅が狭く、フィルタ分布密度が高い。
最後に、LNS特徴から導かれるスペクトルおよび時間変調表現を提案した。
これらのLSNの特徴と変調表現は、ASDのためのオートエンコーダニューラルネットワークベースの検出器に入力される。
6dBの信号対雑音(SNR)を用いた産業機械調査検査データセットのトレーニングセットの定量化結果から、異なる機械の正常音と異常音の識別情報が周波数領域で非一様に符号化されていることが明らかとなった。
NUFBを用いてこれらの重要な周波数領域を強調することにより、LSS機能は様々なSNR条件下でのAUC(受信動作特性曲線の下での領域)の計量を用いて性能を著しく向上させることができる。
さらに、変調表現はパフォーマンスをさらに向上させることができる。
特に、時間変調はファン、ポンプ、スライダーに有効であり、スペクトル変調は特にバルブに有効である。
関連論文リスト
- Machine Learning-based sEMG Signal Classification for Hand Gesture Recognition [3.9440964696313485]
筋電図(EMG)信号を用いて手の動きを解析・分類する。
本稿では,新しい特徴抽出手法を用いてEMGに基づく手動作認識の性能をベンチマークすることを目的とする。
論文 参考訳(メタデータ) (2024-11-23T21:29:51Z) - Neuromorphic Wireless Split Computing with Multi-Level Spikes [69.73249913506042]
ニューロモルフィックコンピューティングでは、スパイクニューラルネットワーク(SNN)が推論タスクを実行し、シーケンシャルデータを含むワークロードの大幅な効率向上を提供する。
ハードウェアとソフトウェアの最近の進歩は、スパイクニューロン間で交換された各スパイクに数ビットのペイロードを埋め込むことにより、推論精度をさらに高めることを示した。
本稿では,マルチレベルSNNを用いた無線ニューロモルフィック分割計算アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2024-11-07T14:08:35Z) - Tuning Frequency Bias of State Space Models [48.60241978021799]
状態空間モデル(SSM)は、線形時間不変(LTI)システムを利用して、長距離依存のシーケンスを学習する。
その結果,SSMは低周波成分を高周波成分よりも効果的に捕捉する傾向を示した。
論文 参考訳(メタデータ) (2024-10-02T21:04:22Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Frequency and Scale Perspectives of Feature Extraction [5.081561820537235]
ニューラルネットワークの周波数とスケールに対する感度を分析する。
ニューラルネットワークは低周波と中周波のバイアスを持つが、異なるクラスに対して異なる周波数帯域を好む。
これらの観察により、ニューラルネットワークは様々なスケールと周波数で特徴を抽出する能力を学ぶ必要があるという仮説が導かれる。
論文 参考訳(メタデータ) (2023-02-24T06:37:36Z) - Digital noise spectroscopy with a quantum sensor [57.53000001488777]
本稿では,ノイズプロセスの自己相関をサンプリングし,再構成するための量子センシングプロトコルを実験的に導入し,実証する。
ウォルシュノイズ分光法はスピンフリップパルスの単純な配列を利用してディジタルフィルタの完全基底を生成する。
ダイヤモンド中の単一窒素空孔中心の電子スピン上での核スピン浴により生じる有効磁場の自己相関関数を実験的に再構成した。
論文 参考訳(メタデータ) (2022-12-19T02:19:35Z) - Incremental Spatial and Spectral Learning of Neural Operators for
Solving Large-Scale PDEs [86.35471039808023]
Incrmental Fourier Neural Operator (iFNO)を導入し、モデルが使用する周波数モードの数を徐々に増加させる。
iFNOは、各種データセット間の一般化性能を維持したり改善したりしながら、トレーニング時間を短縮する。
提案手法は,既存のフーリエニューラル演算子に比べて20%少ない周波数モードを用いて,10%低いテスト誤差を示すとともに,30%高速なトレーニングを実現する。
論文 参考訳(メタデータ) (2022-11-28T09:57:15Z) - Feature anomaly detection system (FADS) for intelligent manufacturing [0.0]
FADS(Feature-based Anomaly Detection System)と呼ばれる新しい異常検出アルゴリズムを提案する。
FADSは畳み込みフィルタの活性化を観察して名目入力の統計モデルを生成する。
推測中、システムは新しい入力の畳み込みフィルタのアクティベーションを、期待値の範囲外である統計モデルとフラグのアクティベーションと比較する。
論文 参考訳(メタデータ) (2022-04-21T17:54:37Z) - SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with
Adaptive Noise Spectral Shaping [51.698273019061645]
SpecGradは拡散雑音に適応し、その時間変化スペクトル包絡が条件付き対数メル分光器に近づく。
時間周波数領域で処理され、計算コストは従来のDDPMベースのニューラルボコーダとほぼ同じである。
論文 参考訳(メタデータ) (2022-03-31T02:08:27Z) - Physics-informed neural network for ultrasound nondestructive
quantification of surface breaking cracks [0.0]
本研究では,金属板の表面破壊ひび割れの同定と特徴化の問題を解決するために,最適化された物理情報ニューラルネットワーク(PINN)を導入する。
PINNは、損失関数に部分微分方程式系の残基を追加することによって、学習過程におけるデータと物理を組み合わせることができるニューラルネットワークである。
PINNを用いて,1%の誤差で行う金属板の音速を推定し,音速の空間依存性を許容することにより,音速が低下した位置としてひび割れを識別・特徴付ける。
論文 参考訳(メタデータ) (2020-05-07T16:32:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。