Fugu-MT 論文翻訳(概要): Anomalous Sound Detection using unsupervised and semi-supervised autoencoders and gammatone audio representation

論文の概要: Anomalous Sound Detection using unsupervised and semi-supervised autoencoders and gammatone audio representation

arxiv url: http://arxiv.org/abs/2006.15321v1
Date: Sat, 27 Jun 2020 08:25:47 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-16 08:17:01.539389
Title: Anomalous Sound Detection using unsupervised and semi-supervised autoencoders and gammatone audio representation
Title（参考訳）: 教師なし・半教師付きオートエンコーダとガンマトン音響表現を用いた異常音検出
Authors: Sergi Perez-Castanos, Javier Naranjo-Alcazar, Pedro Zuccarello and Maximo Cobos
Abstract要約: 本稿では,畳み込みオートエンコーダとガンマトーンに基づく音声表現に基づく新しいフレームワークを提案する。機械の故障や損傷を早期に検出することは、大きな節約と産業プロセスの効率の向上を意味する可能性がある。
参考スコア（独自算出の注目度）: 4.591851728010269
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Anomalous sound detection (ASD) is, nowadays, one of the topical subjects in machine listening discipline. Unsupervised detection is attracting a lot of interest due to its immediate applicability in many fields. For example, related to industrial processes, the early detection of malfunctions or damage in machines can mean great savings and an improvement in the efficiency of industrial processes. This problem can be solved with an unsupervised ASD solution since industrial machines will not be damaged simply by having this audio data in the training stage. This paper proposes a novel framework based on convolutional autoencoders (both unsupervised and semi-supervised) and a Gammatone-based representation of the audio. The results obtained by these architectures substantially exceed the results presented as a baseline.
Abstract（参考訳）: 異常音検出(ASD)は近年,機械聴取分野における話題の一つとなっている。教師なし検出は、多くの分野ですぐに適用できるため、多くの関心を集めている。例えば、産業プロセスに関連して、機械の故障や損傷を早期に検出することは、大きな節約と産業プロセスの効率の向上を意味する。この問題は、このオーディオデータをトレーニング段階で持つだけでは産業機械が損傷を受けないため、教師なしのSDソリューションで解決できる。本稿では,畳み込み型オートエンコーダ(教師なしと半教師付きの両方)とガンマトンに基づく音声表現に基づく新しいフレームワークを提案する。これらのアーキテクチャによって得られた結果は、ベースラインとして提示された結果を大幅に上回る。

関連論文リスト

Multi-agent Auditory Scene Analysis [0.0]
聴覚シーン分析(ASA)は、音源の位置、分離、分類の3つの主要なタスクを実行することで、音環境から情報を取得することを目的としている。これらのタスクを実行すると、全体のレスポンス時間がリニアに増加し、最後のタスクは最初のタスク(ロケーション)のエラーに非常に敏感になる。タスクを並列に実行し、各タスク間のフィードバックループでローカルエラーを補うためのマルチエージェントアプローチを提案する。
論文参考訳（メタデータ） (2025-07-03T16:16:46Z)
Deciphering GunType Hierarchy through Acoustic Analysis of Gunshot Recordings [72.55205022155394]
銃乱射事件や銃乱射事件は公共の安全にとって重大な脅威である。現在の商用の銃弾検出システムは有効だが、しばしば禁止費用がかかる。本研究は, ショット記録の音響解析を活用することで, 費用対効果について検討する。
論文参考訳（メタデータ） (2025-06-25T17:00:21Z)
SoftPatch+: Fully Unsupervised Anomaly Classification and Segmentation [84.07909405887696]
本論文は、完全教師なし産業異常検出(すなわち、ノイズデータ付き教師なしAD)を初めて検討したものである。メモリベースの非教師なしAD手法であるSoftPatchとSoftPatch+を提案する。既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。様々なノイズシナリオで実施された総合的な実験により、SoftPatchとSoftPatch+はMVTecAD、ViSA、BTADのベンチマークで最先端のADメソッドよりも優れていた。
論文参考訳（メタデータ） (2024-12-30T11:16:49Z)
Activity-Guided Industrial Anomalous Sound Detection against Interferences [8.864726245462908]
ソース分離(SS)と異常検出(AD)のフレームワークであるSSADを提案する。 SSADは、(i)アクティビティインフォームドSS、(i)アクティビティインフォームドSS、(ii)2ステップマスキング、および(ii)マシンアクティビティに沿った異常を強調して異常検出を堅牢化する2つのコンポーネントから構成される。実験により,SSADはクリーン信号に完全アクセス可能なベースラインに匹敵する精度を達成し,SSADは劣化信号と活動情報のみを提供することを示した。
論文参考訳（メタデータ） (2024-09-03T13:26:25Z)
GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文参考訳（メタデータ） (2024-07-17T09:27:41Z)
SoftPatch: Unsupervised Anomaly Detection with Noisy Data [67.38948127630644]
本稿では,画像センサ異常検出におけるラベルレベルのノイズを初めて考察する。本稿では,メモリベースの非教師付きAD手法であるSoftPatchを提案する。既存の手法と比較して、SoftPatchは通常のデータの強力なモデリング能力を維持し、コアセットにおける過信問題を軽減する。
論文参考訳（メタデータ） (2024-03-21T08:49:34Z)
Acoustic Signal Analysis with Deep Neural Network for Detecting Fault Diagnosis in Industrial Machines [0.0]
本研究では,産業機械が生み出す音声信号を分析するための深層学習システムについて検討した。提案手法の精度は97.17%から99.87%まで変化した。
論文参考訳（メタデータ） (2023-12-02T08:09:27Z)
Unsupervised Anomaly Detection and Localization of Machine Audio: A GAN-based Approach [17.85309428707623]
AEGAN-ADは、入力スペクトログラムを再構成するためにジェネレータを訓練する全く教師なしのアプローチである。 DCASE 2022 Challenge TASK 2のデータセット上でのAEGAN-ADの性能は、最先端の結果を示している。
論文参考訳（メタデータ） (2023-03-31T10:27:36Z)
Deepfake audio detection by speaker verification [79.99653758293277]
本研究では,話者の生体特性のみを活用する新しい検出手法を提案する。提案手法は,既成話者検証ツールに基づいて実装することができる。そこで我々は,3つの一般的なテストセット上で,優れた性能,高い一般化能力,高ロバスト性を有する音声障害に対する高ロバスト性を検証した。
論文参考訳（メタデータ） (2022-09-28T13:46:29Z)
Should All Proposals be Treated Equally in Object Detection? [110.27485090952385]
オブジェクト検出器の複雑さと精度のトレードオフは、リソース制約されたビジョンタスクにとって重要な問題である。検出効率の改善には、提案の不平等な処理に向けて、パラダイムシフトが必要であると仮定されている。これにより、利用可能な計算予算がより有効になり、同じFLOPSの精度が向上する。
論文参考訳（メタデータ） (2022-07-07T18:26:32Z)
Canonical Polyadic Decomposition and Deep Learning for Machine Fault Detection [0.0]
マシンからあらゆる種類の障害を学ぶのに十分なデータを集めることは不可能である。健康状態のみのデータを用いてトレーニングされた新しいアルゴリズムを開発し、教師なしの異常検出を行った。これらのアルゴリズムの開発における重要な問題は、異常検出性能に影響を与える信号のノイズである。
論文参考訳（メタデータ） (2021-07-20T14:06:50Z)
Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文参考訳（メタデータ） (2021-07-01T08:58:16Z)
Anomaly Detection Based on Selection and Weighting in Latent Space [73.01328671569759]
SWADと呼ばれる新しい選択および重み付けに基づく異常検出フレームワークを提案する。ベンチマークと実世界のデータセットによる実験は、SWADの有効性と優位性を示している。
論文参考訳（メタデータ） (2021-03-08T10:56:38Z)
Acoustic Anomaly Detection for Machine Sounds based on Image Transfer Learning [8.828131257265369]
本稿では,伝達学習による音響的故障検出について考察する。我々は、画像分類のタスクで事前訓練されたニューラルネットワークを使用する。 ResNetベースのネットワークから抽出した機能は、AlexNetやSqueezenetよりも優れた結果が得られることがわかった。
論文参考訳（メタデータ） (2020-06-05T13:29:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。