論文の概要: An artificial neural network-based system for detecting machine failures
using tiny sound data: A case study
- arxiv url: http://arxiv.org/abs/2209.11527v1
- Date: Fri, 23 Sep 2022 11:13:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 17:39:39.456543
- Title: An artificial neural network-based system for detecting machine failures
using tiny sound data: A case study
- Title(参考訳): 小型音響データを用いた人工ニューラルネットワークによる機械故障検出システム
- Authors: Thanh Tran, Sebastian Bader, Jan Lundgren
- Abstract要約: このケーススタディでは,バルメットABから小さなドリル音データセットを増強するための変分オートエンコーダについて検討した。
Valmetデータセットには134の音があり、「異常」と「正常」の2つのカテゴリに分けられている。
我々は,従来の音声から新しい音を合成することで,小さなデータセットの音数を増やすためにVAEを使用した。
強化データセットは、CNNモデルの分類結果を6.62%(拡張データセットでトレーニングされた場合94.12%、元のデータセットでトレーニングされた場合87.5%)に向上させた。
- 参考スコア(独自算出の注目度): 2.1555945141027983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an effort to advocate the research for a deep learning-based machine
failure detection system, we present a case study of our proposed system based
on a tiny sound dataset. Our case study investigates a variational autoencoder
(VAE) for augmenting a small drill sound dataset from Valmet AB. A Valmet
dataset contains 134 sounds that have been divided into two categories:
"Anomaly" and "Normal" recorded from a drilling machine in Valmet AB, a company
in Sundsvall, Sweden that supplies equipment and processes for the production
of biofuels. Using deep learning models to detect failure drills on such a
small sound dataset is typically unsuccessful. We employed a VAE to increase
the number of sounds in the tiny dataset by synthesizing new sounds from
original sounds. The augmented dataset was created by combining these
synthesized sounds with the original sounds. We used a high-pass filter with a
passband frequency of 1000 Hz and a low-pass filter with a passband frequency
of 22\kern 0.16667em000 Hz to pre-process sounds in the augmented dataset
before transforming them to Mel spectrograms. The pre-trained 2D-CNN Alexnet
was then trained using these Mel spectrograms. When compared to using the
original tiny sound dataset to train pre-trained Alexnet, using the augmented
sound dataset enhanced the CNN model's classification results by 6.62\%(94.12\%
when trained on the augmented dataset versus 87.5\% when trained on the
original dataset).
- Abstract(参考訳): 深層学習に基づく機械故障検出システムの研究を提唱するために,提案する音響データに基づくシステムについて事例研究を行う。
本研究は,valmet abからの小型ドリル音データ拡張のための変分オートエンコーダ(vae)について検討する。
ヴァルメットのデータセットには134の音が含まれており、これはスウェーデンのサンズヴァルにあるValmet ABの掘削機から記録された「異常」と「ノーマル」の2つのカテゴリに分けられている。
このような小さな音響データセット上で、ディープラーニングモデルを使用して障害ドリルを検出することは、一般的には失敗する。
我々は,従来の音声から新しい音を合成することで,小さなデータセットの音数を増やすためにVAEを使用した。
強化データセットは、これらの合成された音と元の音を組み合わせたものである。
我々は,1000Hzの帯域通過周波数を持つ高域通過フィルタと22\kern 0.16667em000Hzの帯域通過周波数を持つ低域通過フィルタを用いて,拡張データセット内の音を前処理した後,メルスペクトルに変換する。
事前訓練された2D-CNNAlexnetはこれらのメル分光器を用いて訓練された。
元の小さな音響データセットを使用してトレーニングされたAlexnetと比較すると、強化された音響データセットを使用してCNNモデルの分類結果を6.62\%(94.12\%)、拡張データセットでトレーニングされた場合には87.5\%に向上した。
関連論文リスト
- LEAN: Light and Efficient Audio Classification Network [1.5070398746522742]
音声分類のための軽量デバイス深層学習モデルLEANを提案する。
LEANは、ウェーブニアライメント(Wave realignment)と呼ばれる生波形ベースの時間的特徴抽出器と、ログメルベースの事前学習YAMNetから構成される。
トレーニング可能なウェーブエンコーダと事前学習されたYAMNetとクロスアテンションに基づく時間的アライメントを組み合わせることで、より少ないメモリフットプリントを持つ下流オーディオ分類タスクにおける競合性能が得られることを示す。
論文 参考訳(メタデータ) (2023-05-22T04:45:04Z) - Convolutional Neural Networks for the classification of glitches in
gravitational-wave data streams [52.77024349608834]
我々は、高度LIGO検出器のデータから過渡ノイズ信号(グリッチ)と重力波を分類する。
どちらも、Gravity Spyデータセットを使用して、スクラッチからトレーニングされた、教師付き学習アプローチのモデルを使用します。
また、擬似ラベルの自動生成による事前学習モデルの自己教師型アプローチについても検討する。
論文 参考訳(メタデータ) (2023-03-24T11:12:37Z) - Utilizing synthetic training data for the supervised classification of
rat ultrasonic vocalizations [0.0]
ミューリンは120kHzの周波数で超音波発声(USV)を発生させる。
これらの呼び出しは社会的行動において重要であるため、その分析は声道コミュニケーションの機能とその機能に関する洞察を与えることができる。
我々は、ラットのUSVを含むオーディオにおいて、訓練された人間の2つの畳み込みニューラルネットワーク(CNN)、DeepSqueak、VocalMatの検出と分類性能を比較した。
論文 参考訳(メタデータ) (2023-03-03T03:17:45Z) - Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。
まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。
ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文 参考訳(メタデータ) (2022-08-20T06:46:55Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - SOMOS: The Samsung Open MOS Dataset for the Evaluation of Neural
Text-to-Speech Synthesis [50.236929707024245]
SOMOSデータセットは、単にニューラルテキスト音声(TTS)サンプルからなる最初の大規模平均世論スコア(MOS)データセットである。
パブリックドメイン音声データセットであるLJ音声の合成発話20Kから成っている。
論文 参考訳(メタデータ) (2022-04-06T18:45:20Z) - GPLA-12: An Acoustic Signal Dataset of Gas Pipeline Leakage [9.280474191494363]
本稿では, ガスパイプラインの音響漏れデータセットAsA-12について紹介する。
外部の人工的な漏れを伴う無傷ガスパイプシステムに基づいて音響漏れ信号を収集し, 得られたデータを構造化された調整で前処理する。
データセットをさらに理解するために、影と深層学習の両方のアルゴリズムを訓練して、パフォーマンスを観察する。
論文 参考訳(メタデータ) (2021-06-19T04:37:39Z) - Training Speech Enhancement Systems with Noisy Speech Datasets [7.157870452667369]
本稿では,雑音の多い音声データに基づいてSEシステムの訓練を行うための2つの改良を提案する。
まず、雑音の多い音声のターゲットに対して頑健な損失関数のいくつかの修正を提案する。
従来のシステムと比較して,ロバストな損失関数を用いることでPSSQが最大0.19向上することを示す。
論文 参考訳(メタデータ) (2021-05-26T03:32:39Z) - Crackle Detection In Lung Sounds Using Transfer Learning And Multi-Input
Convolitional Neural Networks [26.399917342840265]
肺音のクラックル検出における記録設定のミスマッチに対処するために,転送学習を用いる。
単一の入力畳み込みニューラルネットワーク(CNN)モデルは、肺音の最大の公開データベースであるIBHI 2017を使用して、ソースドメインで事前に訓練されます。
マルチインプットモデルは, クラックや正常な肺音を分類するために, 自己収集肺音データベースのターゲット領域に微調整される。
論文 参考訳(メタデータ) (2021-04-30T11:32:42Z) - Continual Learning for Fake Audio Detection [62.54860236190694]
本論文では,連続学習に基づく手法である忘れずに偽物を検出することで,モデルに新たなスプーフィング攻撃をインクリメンタルに学習させる手法を提案する。
ASVspoof 2019データセットで実験が行われる。
論文 参考訳(メタデータ) (2021-04-15T07:57:05Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。