論文の概要: The Scattering Transform Network with Generalized Morse Wavelets and Its
Application to Music Genre Classification
- arxiv url: http://arxiv.org/abs/2206.07857v1
- Date: Thu, 16 Jun 2022 00:30:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-18 15:23:49.472518
- Title: The Scattering Transform Network with Generalized Morse Wavelets and Its
Application to Music Genre Classification
- Title(参考訳): 一般化モースウェーブレットを用いた散乱変換ネットワークとその音楽ジャンル分類への応用
- Authors: Wai Ho Chak, Naoki Saito, David Weber
- Abstract要約: 我々は、Scattering Transform Network (STN) で一般的に使われているMorlet Waveletの代わりに、一般化Morse Wavelet (GMW) を使うことを提案する。
GMWは真に解析的なウェーブレットのパラメータ化された族を形成し、一方、モーレットウェーブレットは概して解析的である。
本稿では,GTZANデータベースを用いた音楽ジャンル分類において,従来のSTNよりもGMW-STNの方が優れていることを示す。
- 参考スコア(独自算出の注目度): 1.0312968200748118
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose to use the Generalized Morse Wavelets (GMWs) instead of
commonly-used Morlet (or Gabor) wavelets in the Scattering Transform Network
(STN), which we call the GMW-STN, for signal classification problems. The GMWs
form a parameterized family of truly analytic wavelets while the Morlet
wavelets are only approximately analytic. The analyticity of underlying wavelet
filters in the STN is particularly important for nonstationary oscillatory
signals such as music signals because it improves interpretability of the STN
representations by providing multiscale amplitude and phase (and consequently
frequency) information of input signals. We demonstrate the superiority of the
GMW-STN over the conventional STN in music genre classification using the
so-called GTZAN database. Moreover, we show the performance improvement of the
GMW-STN by increasing its number of layers to three over the typical two-layer
STN.}
- Abstract(参考訳): 我々は,gmw-stnと呼ぶ散乱変換ネットワーク (stn) における一般的なモーレット(あるいはガボール)ウェーブレットの代わりに,一般化モースウェーブレット (gmws) を信号分類問題に用いることを提案する。
GMWは真に解析的なウェーブレットのパラメタ化系を形成し、モーレットウェーブレットは概して解析的である。
STNにおけるウェーブレットフィルタの解析は、入力信号のマルチスケール振幅と位相(および周波数)情報を提供することにより、STN表現の解釈性を向上させるため、音楽信号などの非定常振動信号に対して特に重要である。
GTZANデータベースを用いた音楽ジャンル分類において,従来のSTNよりもGMW-STNの方が優れていることを示す。
さらに,GMW-STNの性能向上を,通常の2層STNよりも3層に増やすことにより示す。
}
関連論文リスト
- Dual-Frequency Filtering Self-aware Graph Neural Networks for Homophilic and Heterophilic Graphs [60.82508765185161]
我々は、Dual-Frequency Filtering Self-Aware Graph Neural Networks (DFGNN)を提案する。
DFGNNは低域通過フィルタと高域通過フィルタを統合し、滑らかで詳細な位相的特徴を抽出する。
フィルター比を動的に調整し、ホモフィルグラフとヘテロフィルグラフの両方に対応する。
論文 参考訳(メタデータ) (2024-11-18T04:57:05Z) - FreSh: Frequency Shifting for Accelerated Neural Representation Learning [11.175745750843484]
Inlicit Neural Representations (INR) は、画像、ビデオ、三次元形状などの信号を多層パーセプトロン(MLP)を用いて連続的に表現するための強力なアプローチとして近年注目されている。
低周波の詳細は低周波バイアスを示し、高周波の詳細を正確に捉える能力を制限することが知られている。
本稿では、初期出力の周波数スペクトルと目標信号の周波数スペクトルを一致させる周波数シフト(FreSh)を提案する。
論文 参考訳(メタデータ) (2024-10-07T14:05:57Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - WFTNet: Exploiting Global and Local Periodicity in Long-term Time Series
Forecasting [61.64303388738395]
本稿では,長期連続予測のためのWavelet-Fourier Transform Network (WFTNet)を提案する。
さまざまな時系列データセットのテストでは、WFTNetは他の最先端のベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-09-20T13:44:18Z) - Vector Quantized Time Series Generation with a Bidirectional Prior Model [0.3867363075280544]
時系列生成(TSG)の研究は、主にGAN(Generative Adversarial Networks)とリカレントニューラルネットワーク(RNN)の亜種の使用に焦点を当てている。
本稿では,ベクトル量子化(VQ)技術を用いてTSG問題に対処するTimeVQVAEを提案する。
また、低周波(LF)と高周波(HF)に分かれた時間周波数領域におけるVQモデリングを提案する。
論文 参考訳(メタデータ) (2023-03-08T17:27:39Z) - Learning Spatial-Frequency Transformer for Visual Object Tracking [15.750739748843744]
最近のトラッカーはTransformerを採用して、広く使われているResNetを新しいバックボーンネットワークとして組み合わせたり置き換えたりしている。
これらの操作は、ターゲットオブジェクトの空間的先行を無視し、最適以下の結果をもたらす可能性があると信じている。
本稿では,GPHA(Spatial Prior and High- frequency emphasis Attention)を同時にモデル化した空間周波数変換器を提案する。
論文 参考訳(メタデータ) (2022-08-18T13:46:12Z) - Monogenic Wavelet Scattering Network for Texture Image Classification [1.2183405753834562]
2次元テクスチャ画像分類のための新しいモノニックウェーブレット散乱ネットワーク(MWSN)を提案する。
我々のMWSNは、解釈可能な係数で有用な階層的・方向的特徴を抽出できる。
CUReTテクスチャ画像データベースを用いて,標準STNよりもMWSNの方が優れた性能を示す。
論文 参考訳(メタデータ) (2022-02-25T04:20:16Z) - Frequency-bin entanglement from domain-engineered down-conversion [101.18253437732933]
フィルタや共振器の共振器を用いない離散周波数ビン絡みの単一パス源を提案する。
ドメインエンジニアリングされた非線形結晶を用いて、通信波長で8モードの周波数ビン絡み合った光源を生成する。
論文 参考訳(メタデータ) (2022-01-18T19:00:29Z) - Open-set Classification of Common Waveforms Using A Deep Feed-forward
Network and Binary Isolation Forest Models [13.078132799573705]
受信信号の分類には深層パーセプトロンアーキテクチャを用いる。
システムは、0dB以上のSNRで98%の精度で、オープンセットモードで正しく分類することができる。
論文 参考訳(メタデータ) (2021-10-01T08:15:26Z) - Modulated Periodic Activations for Generalizable Local Functional
Representations [113.64179351957888]
我々は,複数のインスタンスに一般化し,最先端の忠実性を実現する新しい表現を提案する。
提案手法は,画像,映像,形状の汎用的な機能表現を生成し,単一信号に最適化された先行処理よりも高い再構成品質を実現する。
論文 参考訳(メタデータ) (2021-04-08T17:59:04Z) - Noise Homogenization via Multi-Channel Wavelet Filtering for
High-Fidelity Sample Generation in GANs [47.92719758687014]
GAN(Generative Adversarial Networks)のための新しいマルチチャネルウェーブレットに基づくフィルタリング手法を提案する。
ジェネレータにウェーブレットのデコンボリューション層を埋め込むと、結果のGANであるWaveletGANがウェーブレットのデコンボリューションを利用して複数のチャネルによるフィルタリングを学習する。
オープンGANベンチマークツールを用いて,Fashion-MNIST,KMNIST,SVHNデータセットのベンチマーク実験を行った。
論文 参考訳(メタデータ) (2020-05-14T03:40:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。