論文の概要: Guitar Effects Recognition and Parameter Estimation with Convolutional
Neural Networks
- arxiv url: http://arxiv.org/abs/2012.03216v1
- Date: Sun, 6 Dec 2020 08:46:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 13:50:43.665968
- Title: Guitar Effects Recognition and Parameter Estimation with Convolutional
Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いたギター効果認識とパラメータ推定
- Authors: Marco Comunit\`a, Dan Stowell, Joshua D. Reiss
- Abstract要約: 本稿では,13のオーバードライブ,歪み,ファズギター効果の分類とパラメータ推定に畳み込みニューラルネットワークを用いた。
加工されたエレキギターサンプルの新たなデータセットが組み立てられ、4つのサブデータセットがモノフォニックまたはポリフォニックのサンプルで構成された。
結果は、同じまたは異なるサブデータセットでトレーニングされ、テストされたネットワークで比較された。
- 参考スコア(独自算出の注目度): 12.02749916412249
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite the popularity of guitar effects, there is very little existing
research on classification and parameter estimation of specific plugins or
effect units from guitar recordings. In this paper, convolutional neural
networks were used for classification and parameter estimation for 13
overdrive, distortion and fuzz guitar effects. A novel dataset of processed
electric guitar samples was assembled, with four sub-datasets consisting of
monophonic or polyphonic samples and discrete or continuous settings values,
for a total of about 250 hours of processed samples. Results were compared for
networks trained and tested on the same or on a different sub-dataset. We found
that discrete datasets could lead to equally high performance as continuous
ones, whilst being easier to design, analyse and modify. Classification
accuracy was above 80\%, with confusion matrices reflecting similarities in the
effects timbre and circuits design. With parameter values between 0.0 and 1.0,
the mean absolute error is in most cases below 0.05, while the root mean square
error is below 0.1 in all cases but one.
- Abstract(参考訳): ギター効果の人気にもかかわらず、ギター録音からの特定のプラグインやエフェクトユニットの分類とパラメーター推定に関する研究はほとんどない。
本稿では,13のオーバードライブ,歪み,ファズギター効果の分類とパラメータ推定に畳み込みニューラルネットワークを用いた。
モノフォニックまたはポリフォニックのサンプルと離散的または連続的な設定値からなる4つのサブデータセットを合計250時間にわたる処理されたエレクトロギターのサンプルの新たなデータセットを組み立てた。
結果は、同じまたは異なるサブデータセット上でトレーニングおよびテストされたネットワークと比較された。
個別のデータセットは、設計、分析、修正が容易でありながら、連続的なデータセットと同等に高いパフォーマンスをもたらす可能性があることがわかった。
分類精度は80\%を超え, 影響音色と回路設計の類似性を反映した混乱行列が得られた。
0.0から1.0の間のパラメータ値では、平均絶対誤差は0.05以下であり、根平均二乗誤差は0.0.1以下である。
関連論文リスト
- On Input Formats for Radar Micro-Doppler Signature Processing by Convolutional Neural Networks [1.2499537119440245]
位相情報の有用性と畳み込みニューラルネットワークに対するドップラー時間入力の最適なフォーマットを解析する。
畳み込みニューラルネットワーク分類器によって達成された性能は入力表現の種類に大きく影響されている。
論文 参考訳(メタデータ) (2024-04-12T07:30:08Z) - Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.17261694996051]
本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文 参考訳(メタデータ) (2023-09-15T13:50:16Z) - Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio
Detection [54.20974251478516]
本稿では,破滅的な忘れを克服するために,偽音声検出のための連続学習アルゴリズムを提案する。
検出ネットワークを微調整する場合,本手法では,真の発話と偽発話の比率に応じて,重み付けの方向を適応的に計算する。
本手法は,音声の感情認識などの関連分野に容易に一般化できる。
論文 参考訳(メタデータ) (2023-08-07T05:05:49Z) - Real-time Percussive Technique Recognition and Embedding Learning for
the Acoustic Guitar [2.5291326778025143]
リアルタイム音楽情報検索(RT-MIR)は,従来の音響機器の能力を高める可能性が大きい。
本研究では,アコースティックギターとギターボディのパーカッションをブレンドしたパーカッシブフィンガースタイルの強化を目的としたRT-MIR技術を開発した。
本稿では,畳み込みニューラルネットワーク(CNN)と変分オートエンコーダ(VAE)に基づくリアルタイムギターボディパーカッション認識と埋め込み学習技術について述べる。
論文 参考訳(メタデータ) (2023-07-13T10:48:29Z) - Automatic Change-Point Detection in Time Series via Deep Learning [8.43086628139493]
ニューラルネットワークのトレーニングに基づいて,新しいオフライン検出手法を自動生成する方法を示す。
本稿では,そのような手法の誤差率を定量化する理論について述べる。
また,加速度計データに基づく活動変化の検出と位置推定にも強い効果が得られた。
論文 参考訳(メタデータ) (2022-11-07T20:59:14Z) - Audio Deepfake Detection Based on a Combination of F0 Information and
Real Plus Imaginary Spectrogram Features [51.924340387119415]
ASVspoof 2019 LAデータセットの実験結果から,提案手法はオーディオディープフェイク検出に非常に有効であることがわかった。
提案方式は音声深度検出作業に非常に有効であり,ほぼ全てのシステムにまたがる等価誤差率(EER)が0.43%に達する。
論文 参考訳(メタデータ) (2022-08-02T02:46:16Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Ensemble of Convolution Neural Networks on Heterogeneous Signals for
Sleep Stage Scoring [63.30661835412352]
本稿では,脳波以外の追加信号の利用の利便性について検討し,比較する。
最も優れたモデルである深部分離畳み込みニューラルネットワークのアンサンブルは86.06%の精度を達成した。
論文 参考訳(メタデータ) (2021-07-23T06:37:38Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Deep Convolutional and Recurrent Networks for Polyphonic Instrument
Classification from Monophonic Raw Audio Waveforms [30.3491261167433]
サウンドイベント検出とオーディオ分類タスクは、伝統的にスペクトログラムなどのオーディオ信号の時間周波数表現を通じて対処されます。
効率的な特徴抽出器としてのディープニューラルネットワークは、分類目的にオーディオ信号を直接使用可能にする。
生の波形を深層学習モデルに入力するだけで,ポリフォニック・オーディオで楽器を認識する。
論文 参考訳(メタデータ) (2021-02-13T13:44:46Z) - A light neural network for modulation detection under impairments [0.0]
I/Q信号の一部の変調スキームを効率的に検出できるニューラルネットワークアーキテクチャを提案する。
パラメータの数は信号の持続時間に依存しないため、データのストリームを処理することができる。
我々は、伝搬チャネルと復調器が記録したI/Q信号にもたらすことのできる障害のシミュレーションに基づいてデータセットを生成した。
論文 参考訳(メタデータ) (2020-03-27T07:26:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。