論文の概要: An artificial neural network-based system for detecting machine failures
using tiny sound data: A case study
- arxiv url: http://arxiv.org/abs/2209.11527v1
- Date: Fri, 23 Sep 2022 11:13:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 17:39:39.456543
- Title: An artificial neural network-based system for detecting machine failures
using tiny sound data: A case study
- Title(参考訳): 小型音響データを用いた人工ニューラルネットワークによる機械故障検出システム
- Authors: Thanh Tran, Sebastian Bader, Jan Lundgren
- Abstract要約: このケーススタディでは,バルメットABから小さなドリル音データセットを増強するための変分オートエンコーダについて検討した。
Valmetデータセットには134の音があり、「異常」と「正常」の2つのカテゴリに分けられている。
我々は,従来の音声から新しい音を合成することで,小さなデータセットの音数を増やすためにVAEを使用した。
強化データセットは、CNNモデルの分類結果を6.62%(拡張データセットでトレーニングされた場合94.12%、元のデータセットでトレーニングされた場合87.5%)に向上させた。
- 参考スコア(独自算出の注目度): 2.1555945141027983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an effort to advocate the research for a deep learning-based machine
failure detection system, we present a case study of our proposed system based
on a tiny sound dataset. Our case study investigates a variational autoencoder
(VAE) for augmenting a small drill sound dataset from Valmet AB. A Valmet
dataset contains 134 sounds that have been divided into two categories:
"Anomaly" and "Normal" recorded from a drilling machine in Valmet AB, a company
in Sundsvall, Sweden that supplies equipment and processes for the production
of biofuels. Using deep learning models to detect failure drills on such a
small sound dataset is typically unsuccessful. We employed a VAE to increase
the number of sounds in the tiny dataset by synthesizing new sounds from
original sounds. The augmented dataset was created by combining these
synthesized sounds with the original sounds. We used a high-pass filter with a
passband frequency of 1000 Hz and a low-pass filter with a passband frequency
of 22\kern 0.16667em000 Hz to pre-process sounds in the augmented dataset
before transforming them to Mel spectrograms. The pre-trained 2D-CNN Alexnet
was then trained using these Mel spectrograms. When compared to using the
original tiny sound dataset to train pre-trained Alexnet, using the augmented
sound dataset enhanced the CNN model's classification results by 6.62\%(94.12\%
when trained on the augmented dataset versus 87.5\% when trained on the
original dataset).
- Abstract(参考訳): 深層学習に基づく機械故障検出システムの研究を提唱するために,提案する音響データに基づくシステムについて事例研究を行う。
本研究は,valmet abからの小型ドリル音データ拡張のための変分オートエンコーダ(vae)について検討する。
ヴァルメットのデータセットには134の音が含まれており、これはスウェーデンのサンズヴァルにあるValmet ABの掘削機から記録された「異常」と「ノーマル」の2つのカテゴリに分けられている。
このような小さな音響データセット上で、ディープラーニングモデルを使用して障害ドリルを検出することは、一般的には失敗する。
我々は,従来の音声から新しい音を合成することで,小さなデータセットの音数を増やすためにVAEを使用した。
強化データセットは、これらの合成された音と元の音を組み合わせたものである。
我々は,1000Hzの帯域通過周波数を持つ高域通過フィルタと22\kern 0.16667em000Hzの帯域通過周波数を持つ低域通過フィルタを用いて,拡張データセット内の音を前処理した後,メルスペクトルに変換する。
事前訓練された2D-CNNAlexnetはこれらのメル分光器を用いて訓練された。
元の小さな音響データセットを使用してトレーニングされたAlexnetと比較すると、強化された音響データセットを使用してCNNモデルの分類結果を6.62\%(94.12\%)、拡張データセットでトレーニングされた場合には87.5\%に向上した。
関連論文リスト
- Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data [69.7174072745851]
音声分類データセットを合成データで拡張する新しい手法であるSynthioを提案する。
最初の課題を克服するために、好みの最適化を用いて、T2Aモデルの世代と小規模データセットを整列する。
2つ目の課題に対処するために,大規模言語モデルの推論能力を活用する新しいキャプション生成手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T22:05:36Z) - A Deep CNN Model for Ringing Effect Attenuation of Vibroseis Data [8.711367799013466]
振動子の周波数帯域に制限があるため,バイブロサイスデータ処理において「リング効果」は一般的な問題である。
我々は深部畳み込みニューラルネットワーク(CNN)を用いたビブロセイスデータの新しい導出モデルを提案した。
実験結果から,深部CNNモデルはリング効果を効果的に減らし,ビブロセイスデータの帯域幅を拡大できることがわかった。
論文 参考訳(メタデータ) (2024-08-03T17:50:13Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - LEAN: Light and Efficient Audio Classification Network [1.5070398746522742]
音声分類のための軽量デバイス深層学習モデルLEANを提案する。
LEANは、ウェーブニアライメント(Wave realignment)と呼ばれる生波形ベースの時間的特徴抽出器と、ログメルベースの事前学習YAMNetから構成される。
トレーニング可能なウェーブエンコーダと事前学習されたYAMNetとクロスアテンションに基づく時間的アライメントを組み合わせることで、より少ないメモリフットプリントを持つ下流オーディオ分類タスクにおける競合性能が得られることを示す。
論文 参考訳(メタデータ) (2023-05-22T04:45:04Z) - Utilizing synthetic training data for the supervised classification of
rat ultrasonic vocalizations [0.0]
ミューリンは120kHzの周波数で超音波発声(USV)を発生させる。
これらの呼び出しは社会的行動において重要であるため、その分析は声道コミュニケーションの機能とその機能に関する洞察を与えることができる。
我々は、ラットのUSVを含むオーディオにおいて、訓練された人間の2つの畳み込みニューラルネットワーク(CNN)、DeepSqueak、VocalMatの検出と分類性能を比較した。
論文 参考訳(メタデータ) (2023-03-03T03:17:45Z) - Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。
まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。
ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文 参考訳(メタデータ) (2022-08-20T06:46:55Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - Training Speech Enhancement Systems with Noisy Speech Datasets [7.157870452667369]
本稿では,雑音の多い音声データに基づいてSEシステムの訓練を行うための2つの改良を提案する。
まず、雑音の多い音声のターゲットに対して頑健な損失関数のいくつかの修正を提案する。
従来のシステムと比較して,ロバストな損失関数を用いることでPSSQが最大0.19向上することを示す。
論文 参考訳(メタデータ) (2021-05-26T03:32:39Z) - Continual Learning for Fake Audio Detection [62.54860236190694]
本論文では,連続学習に基づく手法である忘れずに偽物を検出することで,モデルに新たなスプーフィング攻撃をインクリメンタルに学習させる手法を提案する。
ASVspoof 2019データセットで実験が行われる。
論文 参考訳(メタデータ) (2021-04-15T07:57:05Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。