Fugu-MT 論文翻訳(概要): An artificial neural network-based system for detecting machine failures using tiny sound data: A case study

論文の概要: An artificial neural network-based system for detecting machine failures using tiny sound data: A case study

arxiv url: http://arxiv.org/abs/2209.11527v1
Date: Fri, 23 Sep 2022 11:13:22 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-26 17:39:39.456543
Title: An artificial neural network-based system for detecting machine failures using tiny sound data: A case study
Title（参考訳）: 小型音響データを用いた人工ニューラルネットワークによる機械故障検出システム
Authors: Thanh Tran, Sebastian Bader, Jan Lundgren
Abstract要約: このケーススタディでは,バルメットABから小さなドリル音データセットを増強するための変分オートエンコーダについて検討した。 Valmetデータセットには134の音があり、「異常」と「正常」の2つのカテゴリに分けられている。我々は,従来の音声から新しい音を合成することで,小さなデータセットの音数を増やすためにVAEを使用した。強化データセットは、CNNモデルの分類結果を6.62%(拡張データセットでトレーニングされた場合94.12%、元のデータセットでトレーニングされた場合87.5%)に向上させた。
参考スコア（独自算出の注目度）: 2.1555945141027983
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In an effort to advocate the research for a deep learning-based machine failure detection system, we present a case study of our proposed system based on a tiny sound dataset. Our case study investigates a variational autoencoder (VAE) for augmenting a small drill sound dataset from Valmet AB. A Valmet dataset contains 134 sounds that have been divided into two categories: "Anomaly" and "Normal" recorded from a drilling machine in Valmet AB, a company in Sundsvall, Sweden that supplies equipment and processes for the production of biofuels. Using deep learning models to detect failure drills on such a small sound dataset is typically unsuccessful. We employed a VAE to increase the number of sounds in the tiny dataset by synthesizing new sounds from original sounds. The augmented dataset was created by combining these synthesized sounds with the original sounds. We used a high-pass filter with a passband frequency of 1000 Hz and a low-pass filter with a passband frequency of 22\kern 0.16667em000 Hz to pre-process sounds in the augmented dataset before transforming them to Mel spectrograms. The pre-trained 2D-CNN Alexnet was then trained using these Mel spectrograms. When compared to using the original tiny sound dataset to train pre-trained Alexnet, using the augmented sound dataset enhanced the CNN model's classification results by 6.62\%(94.12\% when trained on the augmented dataset versus 87.5\% when trained on the original dataset).
Abstract（参考訳）: 深層学習に基づく機械故障検出システムの研究を提唱するために,提案する音響データに基づくシステムについて事例研究を行う。本研究は,valmet abからの小型ドリル音データ拡張のための変分オートエンコーダ(vae)について検討する。ヴァルメットのデータセットには134の音が含まれており、これはスウェーデンのサンズヴァルにあるValmet ABの掘削機から記録された「異常」と「ノーマル」の2つのカテゴリに分けられている。このような小さな音響データセット上で、ディープラーニングモデルを使用して障害ドリルを検出することは、一般的には失敗する。我々は,従来の音声から新しい音を合成することで,小さなデータセットの音数を増やすためにVAEを使用した。強化データセットは、これらの合成された音と元の音を組み合わせたものである。我々は,1000Hzの帯域通過周波数を持つ高域通過フィルタと22\kern 0.16667em000Hzの帯域通過周波数を持つ低域通過フィルタを用いて,拡張データセット内の音を前処理した後,メルスペクトルに変換する。事前訓練された2D-CNNAlexnetはこれらのメル分光器を用いて訓練された。元の小さな音響データセットを使用してトレーニングされたAlexnetと比較すると、強化された音響データセットを使用してCNNモデルの分類結果を6.62\%(94.12\%)、拡張データセットでトレーニングされた場合には87.5\%に向上した。

関連論文リスト

What Makes Good Synthetic Training Data for Zero-Shot Stereo Matching? [57.49867420132091]
標準ベンチマークを用いてゼロショットステレオマッチング性能への影響を報告する。最適な設定を収集し、大規模なデータセットを作成することで、結果を検証する。我々は,プロシージャステレオデータセットのさらなる研究を可能にするために,我々のシステムをオープンソース化した。
論文参考訳（メタデータ） (2025-04-23T17:59:33Z)
Synthio: Augmenting Small-Scale Audio Classification Datasets with Synthetic Data [69.7174072745851]
音声分類データセットを合成データで拡張する新しい手法であるSynthioを提案する。最初の課題を克服するために、好みの最適化を用いて、T2Aモデルの世代と小規模データセットを整列する。 2つ目の課題に対処するために,大規模言語モデルの推論能力を活用する新しいキャプション生成手法を提案する。
論文参考訳（メタデータ） (2024-10-02T22:05:36Z)
A Deep CNN Model for Ringing Effect Attenuation of Vibroseis Data [8.711367799013466]
振動子の周波数帯域に制限があるため,バイブロサイスデータ処理において「リング効果」は一般的な問題である。我々は深部畳み込みニューラルネットワーク(CNN)を用いたビブロセイスデータの新しい導出モデルを提案した。実験結果から,深部CNNモデルはリング効果を効果的に減らし,ビブロセイスデータの帯域幅を拡大できることがわかった。
論文参考訳（メタデータ） (2024-08-03T17:50:13Z)
Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。 RAFは密集した室内音響データを提供する最初のデータセットである。
論文参考訳（メタデータ） (2024-03-27T17:59:56Z)
LEAN: Light and Efficient Audio Classification Network [1.5070398746522742]
音声分類のための軽量デバイス深層学習モデルLEANを提案する。 LEANは、ウェーブニアライメント(Wave realignment)と呼ばれる生波形ベースの時間的特徴抽出器と、ログメルベースの事前学習YAMNetから構成される。トレーニング可能なウェーブエンコーダと事前学習されたYAMNetとクロスアテンションに基づく時間的アライメントを組み合わせることで、より少ないメモリフットプリントを持つ下流オーディオ分類タスクにおける競合性能が得られることを示す。
論文参考訳（メタデータ） (2023-05-22T04:45:04Z)
Utilizing synthetic training data for the supervised classification of rat ultrasonic vocalizations [0.0]
ミューリンは120kHzの周波数で超音波発声(USV)を発生させる。これらの呼び出しは社会的行動において重要であるため、その分析は声道コミュニケーションの機能とその機能に関する洞察を与えることができる。我々は、ラットのUSVを含むオーディオにおいて、訓練された人間の2つの畳み込みニューラルネットワーク(CNN)、DeepSqueak、VocalMatの検出と分類性能を比較した。
論文参考訳（メタデータ） (2023-03-03T03:17:45Z)
Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文参考訳（メタデータ） (2022-08-20T06:46:55Z)
BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文参考訳（メタデータ） (2022-07-27T09:26:15Z)
Training Speech Enhancement Systems with Noisy Speech Datasets [7.157870452667369]
本稿では,雑音の多い音声データに基づいてSEシステムの訓練を行うための2つの改良を提案する。まず、雑音の多い音声のターゲットに対して頑健な損失関数のいくつかの修正を提案する。従来のシステムと比較して,ロバストな損失関数を用いることでPSSQが最大0.19向上することを示す。
論文参考訳（メタデータ） (2021-05-26T03:32:39Z)
Continual Learning for Fake Audio Detection [62.54860236190694]
本論文では,連続学習に基づく手法である忘れずに偽物を検出することで,モデルに新たなスプーフィング攻撃をインクリメンタルに学習させる手法を提案する。 ASVspoof 2019データセットで実験が行われる。
論文参考訳（メタデータ） (2021-04-15T07:57:05Z)
Fast accuracy estimation of deep learning based multi-class musical source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文参考訳（メタデータ） (2020-10-19T13:05:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。