Fugu-MT 論文翻訳(概要): Audio Classification of Low Feature Spectrograms Utilizing Convolutional Neural Networks

論文の概要: Audio Classification of Low Feature Spectrograms Utilizing Convolutional Neural Networks

arxiv url: http://arxiv.org/abs/2410.21561v1
Date: Mon, 28 Oct 2024 21:48:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:41.613903
Title: Audio Classification of Low Feature Spectrograms Utilizing Convolutional Neural Networks
Title（参考訳）: 畳み込みニューラルネットワークを用いた低特徴スペクトログラムのオーディオ分類
Authors: Noel Elias,
Abstract要約: 本稿では,データ分布の低い音声スペクトログラムを解析するための機械学習手法をいくつか提案する。特に,二分法,一級法,シムズ法を用いて特徴を抽出する新しい畳み込みアーキテクチャを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Modern day audio signal classification techniques lack the ability to classify low feature audio signals in the form of spectrographic temporal frequency data representations. Additionally, currently utilized techniques rely on full diverse data sets that are often not representative of real-world distributions. This paper derives several first-of-its-kind machine learning methodologies to analyze these low feature audio spectrograms given data distributions that may have normalized, skewed, or even limited training sets. In particular, this paper proposes several novel customized convolutional architectures to extract identifying features using binary, one-class, and siamese approaches to identify the spectrographic signature of a given audio signal. Utilizing these novel convolutional architectures as well as the proposed classification methods, these experiments demonstrate state-of-the-art classification accuracy and improved efficiency than traditional audio classification methods.
Abstract（参考訳）: 現代の音声信号分類技術では、スペクトル時間周波数データ表現の形で低特徴音声信号を分類する能力が欠如している。さらに、現在活用されている技術は、実世界の分布を表わさないような、完全な多様なデータセットに依存している。本稿では、正規化、歪んだ、あるいは制限されたトレーニングセットを与えられたデータ分布から、これらの低機能音声スペクトログラムを解析するための、先駆的な機械学習手法を導出する。特に,2進法,1級法,シソーマ法を用いて識別特徴を抽出し,与えられた音声信号のスペクトル的シグネチャを識別する新しい畳み込みアーキテクチャを提案する。これらの新しい畳み込みアーキテクチャと提案手法を用いて,従来の音声分類法よりも最先端の分類精度と効率の向上を実証した。

関連論文リスト

A Novel Score-CAM based Denoiser for Spectrographic Signature Extraction without Ground Truth [0.0]
本稿では,Score-CAMをベースとした新しいデノイザを開発し,ノイズスペクトルデータからオブジェクトのシグネチャを抽出する。特に,本論文では,スペクトルトレーニングデータの学習と生成のための,新たな生成逆ネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2024-10-28T21:40:46Z)
Heterogeneous sound classification with the Broad Sound Taxonomy and Dataset [6.91815289914328]
本稿では,異種音の自動分類手法について検討する。手動のアノテーションによってデータセットを構築し、精度、クラスごとの多様な表現、実世界のシナリオにおける関連性を保証する。実験結果から,音響情報や意味情報をエンコードした音声埋め込みは,分類作業において高い精度を実現することが示された。
論文参考訳（メタデータ） (2024-10-01T18:09:02Z)
On the Frequency Bias of Generative Models [61.60834513380388]
我々は、最先端のGANトレーニングにおいて、高周波アーティファクトに対する提案手法を解析した。既存のアプローチでは、スペクトルアーティファクトを完全に解決できないことが分かっています。以上の結果から,識別能力の向上に大きな可能性があることが示唆された。
論文参考訳（メタデータ） (2021-11-03T18:12:11Z)
A Review of Sound Source Localization with Deep Learning Methods [71.18444724397486]
本稿では,単音源および複数音源の音源定位のための深層学習手法について概説する。この文脈におけるニューラルネットワークを用いた局所化文献の網羅的なトポグラフィーを提供する。文献レビューを要約したテーブルをレビューの最後に提供し、所定の対象特性のセットでメソッドを素早く検索する。
論文参考訳（メタデータ） (2021-09-08T07:25:39Z)
Anomalous Sound Detection Using a Binary Classification Model and Class Centroids [47.856367556856554]
本稿では, 正規データだけでなく, 他領域の外部データも擬似アノマラス音響データとして用いた二分分類モデルを提案する。また,2値分類モデルをさらに改善するために,異常音データの追加の有効性についても検討した。
論文参考訳（メタデータ） (2021-06-11T03:35:06Z)
Discriminative Singular Spectrum Classifier with Applications on Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文参考訳（メタデータ） (2021-03-18T11:01:21Z)
Deep Convolutional and Recurrent Networks for Polyphonic Instrument Classification from Monophonic Raw Audio Waveforms [30.3491261167433]
サウンドイベント検出とオーディオ分類タスクは、伝統的にスペクトログラムなどのオーディオ信号の時間周波数表現を通じて対処されます。効率的な特徴抽出器としてのディープニューラルネットワークは、分類目的にオーディオ信号を直接使用可能にする。生の波形を深層学習モデルに入力するだけで,ポリフォニック・オーディオで楽器を認識する。
論文参考訳（メタデータ） (2021-02-13T13:44:46Z)
Capturing scattered discriminative information using a deep architecture in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。 2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文参考訳（メタデータ） (2020-07-09T08:32:06Z)
Unsupervised Domain Adaptation for Acoustic Scene Classification Using Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文参考訳（メタデータ） (2020-04-30T23:56:05Z)
Robust Classification of High-Dimensional Spectroscopy Data Using Deep Learning and Data Synthesis [0.5801044612920815]
分光データのバイナリ分類における局所接続型ニューラルネットワーク(NN)の新たな応用を提案する。 2段階の分類プロセスは、2段階の分類パラダイムと1段階の分類パラダイムの代替として提示される。
論文参考訳（メタデータ） (2020-03-26T11:33:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。