論文の概要: A Novel Score-CAM based Denoiser for Spectrographic Signature Extraction without Ground Truth
- arxiv url: http://arxiv.org/abs/2410.21557v2
- Date: Wed, 30 Oct 2024 02:02:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-31 09:40:48.032984
- Title: A Novel Score-CAM based Denoiser for Spectrographic Signature Extraction without Ground Truth
- Title(参考訳): 地中真実のない分光信号抽出のためのスコアCAMに基づく新しいデノイザ
- Authors: Noel Elias,
- Abstract要約: 本稿では,Score-CAMをベースとした新しいデノイザを開発し,ノイズスペクトルデータからオブジェクトのシグネチャを抽出する。
特に,本論文では,スペクトルトレーニングデータの学習と生成のための,新たな生成逆ネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Sonar based audio classification techniques are a growing area of research in the field of underwater acoustics. Usually, underwater noise picked up by passive sonar transducers contains all types of signals that travel through the ocean and is transformed into spectrographic images. As a result, the corresponding spectrograms intended to display the temporal-frequency data of a certain object often include the tonal regions of abundant extraneous noise that can effectively interfere with a 'contact'. So, a majority of spectrographic samples extracted from underwater audio signals are rendered unusable due to their clutter and lack the required indistinguishability between different objects. With limited clean true data for supervised training, creating classification models for these audio signals is severely bottlenecked. This paper derives several new techniques to combat this problem by developing a novel Score-CAM based denoiser to extract an object's signature from noisy spectrographic data without being given any ground truth data. In particular, this paper proposes a novel generative adversarial network architecture for learning and producing spectrographic training data in similar distributions to low-feature spectrogram inputs. In addition, this paper also a generalizable class activation mapping based denoiser for different distributions of acoustic data, even real-world data distributions. Utilizing these novel architectures and proposed denoising techniques, these experiments demonstrate state-of-the-art noise reduction accuracy and improved classification accuracy than current audio classification standards. As such, this approach has applications not only to audio data but for countless data distributions used all around the world for machine learning.
- Abstract(参考訳): ソナーに基づく音響分類技術は水中音響学の分野における研究領域の増大である。
通常、受動ソナートランスデューサによって拾われた水中ノイズは、海を流れるあらゆる種類の信号を含み、分光画像に変換される。
結果として、ある物体の時間周波数データを表示しようとする対応する分光器は、しばしば「接触」に効果的に干渉できる豊富な外ノイズの音域を含む。
そのため、水中の音声信号から抽出された分光サンプルの大部分は、その乱れのために使用不能にされ、異なる物体間の不明瞭さが欠如している。
教師付きトレーニングのためのクリーンな真のデータに制限があるため、これらの音声信号の分類モデルを作成することは、非常にボトルネックとなる。
本稿では,Score-CAMをベースとした新しいノイズキャンセラーを開発し,ノイズの多いスペクトルデータから物体の署名を抽出し,基礎的な真理データを与えることなく,この問題に対処する新しい手法を考案する。
特に,低機能なスペクトログラム入力に類似した分布でスペクトルトレーニングデータを学習し,生成する,新たな逆ネットワークアーキテクチャを提案する。
さらに,本論文では,音響データ,実世界のデータ分布の異なる分布に対して,一般化可能なクラスアクティベーションマッピングに基づくデノイザについても述べる。
これらの新しいアーキテクチャと提案手法を利用して、これらの実験は最先端のノイズ低減精度を実証し、現在の音声分類基準よりも分類精度を向上させた。
このように、このアプローチは、オーディオデータだけでなく、世界中の機械学習に使われている数え切れないほどのデータ分布にも応用できる。
関連論文リスト
- Audio Classification of Low Feature Spectrograms Utilizing Convolutional Neural Networks [0.0]
本稿では,データ分布の低い音声スペクトログラムを解析するための機械学習手法をいくつか提案する。
特に,二分法,一級法,シムズ法を用いて特徴を抽出する新しい畳み込みアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-10-28T21:48:57Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - Histogram Layer Time Delay Neural Networks for Passive Sonar
Classification [58.720142291102135]
時間遅延ニューラルネットワークとヒストグラム層を組み合わせた新しい手法により,特徴学習の改善と水中音響目標分類を実現する。
提案手法はベースラインモデルより優れており,受動的ソナー目標認識のための統計的文脈を取り入れた有効性を示す。
論文 参考訳(メタデータ) (2023-07-25T19:47:26Z) - Weak-signal extraction enabled by deep-neural-network denoising of
diffraction data [26.36525764239897]
深層畳み込みニューラルネットワークを用いて、データの復号化を図示する。
ノイズの多いデータでは、電荷の順序から生じる弱信号が可視化され、精度が向上することを示す。
論文 参考訳(メタデータ) (2022-09-19T14:43:01Z) - Acoustic-Net: A Novel Neural Network for Sound Localization and
Quantification [28.670240455952317]
アコースティックネットと呼ばれる新しいニューラルネットワークが提案され、音源の特定と定量化が可能である。
実験により,提案手法は音源予測の精度と計算速度を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2022-03-31T12:20:09Z) - On the Frequency Bias of Generative Models [61.60834513380388]
我々は、最先端のGANトレーニングにおいて、高周波アーティファクトに対する提案手法を解析した。
既存のアプローチでは、スペクトルアーティファクトを完全に解決できないことが分かっています。
以上の結果から,識別能力の向上に大きな可能性があることが示唆された。
論文 参考訳(メタデータ) (2021-11-03T18:12:11Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Analysing the Noise Model Error for Realistic Noisy Label Data [14.766574408868806]
本研究では,ノイズモデルの予測誤差を導出して,理論的な側面から推定ノイズモデルの品質について検討する。
NLPドメインから新たなノイズラベルデータセットであるNoisyNERも公開しています。
論文 参考訳(メタデータ) (2021-01-24T17:45:15Z) - Ensemble of Discriminators for Domain Adaptation in Multiple Sound
Source 2D Localization [7.564344795030588]
本稿では,複数音源の局所化のための領域適応手法の精度を向上させる識別器のアンサンブルを提案する。
このようなデータセットの記録とラベリングは、特にさまざまな音響条件をカバーするために十分な多様性を必要とするため、非常にコストがかかる。
論文 参考訳(メタデータ) (2020-12-10T09:17:29Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。