論文の概要: Music Tempo Estimation via Neural Networks -- A Comparative Analysis
- arxiv url: http://arxiv.org/abs/2107.09208v1
- Date: Tue, 20 Jul 2021 00:29:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-21 14:45:31.790274
- Title: Music Tempo Estimation via Neural Networks -- A Comparative Analysis
- Title(参考訳): ニューラルネットワークによる音楽テンポ推定 -比較分析-
- Authors: Mila Soares de Oliveira de Souza and Pedro Nuno de Souza Moura and
Jean-Pierre Briot
- Abstract要約: 本稿では,2つのニューラルネットワーク(異なるアーキテクチャ)の比較分析を行い,テンポ推定の課題について述べる。
また,B-RNNモデルのモデル化,訓練,評価を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a comparative analysis on two artificial neural networks
(with different architectures) for the task of tempo estimation. For this
purpose, it also proposes the modeling, training and evaluation of a B-RNN
(Bidirectional Recurrent Neural Network) model capable of estimating tempo in
bpm (beats per minutes) of musical pieces, without using external auxiliary
modules. An extensive database (12,550 pieces in total) was curated to conduct
a quantitative and qualitative analysis over the experiment. Percussion-only
tracks were also included in the dataset. The performance of the B-RNN is
compared to that of state-of-the-art models. For further comparison, a
state-of-the-art CNN was also retrained with the same datasets used for the
B-RNN training. Evaluation results for each model and datasets are presented
and discussed, as well as observations and ideas for future research. Tempo
estimation was more accurate for the percussion only dataset, suggesting that
the estimation can be more accurate for percussion-only tracks, although
further experiments (with more of such datasets) should be made to gather
stronger evidence.
- Abstract(参考訳): 本稿では,2つのニューラルネットワーク(異なるアーキテクチャ)の比較分析を行い,テンポ推定の課題について述べる。
この目的のために、外部の補助モジュールを使用せずに楽曲のbpm(beats per minutes)におけるテンポを推定できるb-rnn(bidirectional recurrent neural network)モデルのモデリング、トレーニング、評価も提案している。
大規模なデータベース(合計12,550個)がキュレーションされ、実験の量的および質的な分析が行われた。
パーカッションのみのトラックもデータセットに含まれている。
B-RNNの性能は最先端のモデルと比較される。
さらに比較するために、最先端のCNNも、B-RNNトレーニングに使用される同じデータセットで再トレーニングされた。
各モデルとデータセットの評価結果が提示され、今後の研究のための観測とアイデアが議論される。
パーカッションのみのデータセットではテンポ推定の方が正確であり、パーカッションのみのトラックでは推定がより正確であることが示唆された。
関連論文リスト
- Time Elastic Neural Networks [2.1756081703276]
時間弾性ニューラルネットワーク(teNN)という,非定型ニューラルネットワークアーキテクチャの導入と詳細化について述べる。
古典的ニューラルネットワークアーキテクチャと比較して新しいのは、時間ゆがみ能力を明確に組み込んでいることだ。
トレーニング過程において,TENNは各細胞に必要となるニューロン数を減少させることに成功した。
論文 参考訳(メタデータ) (2024-05-27T09:01:30Z) - Towards a Phenomenological Understanding of Neural Networks: Data [1.2985510601654955]
集合変数に基づいて構築されたニューラルネットワークの理論(NN)は、科学者に各段階での学習プロセスをよりよく理解するためのツールを提供する。
本研究では、モデルに渡されるトレーニングデータに基づいて構築された経験的ニューラルネットワークカーネル(NTK)のエントロピーとトレースという2つの変数を紹介する。
我々は、開始エントロピー、NTKのトレース、および訓練後に計算されたモデルの一般化の相関関係が得られた。
論文 参考訳(メタデータ) (2023-05-01T18:00:01Z) - Contextually Enhanced ES-dRNN with Dynamic Attention for Short-Term Load
Forecasting [1.1602089225841632]
提案手法は,コンテキストトラックとメイントラックという,同時に訓練された2つのトラックから構成される。
RNNアーキテクチャは、階層的な拡張を積み重ねた複数の繰り返し層で構成され、最近提案された注意的再帰細胞を備えている。
このモデルは点予測と予測間隔の両方を生成する。
論文 参考訳(メタデータ) (2022-12-18T07:42:48Z) - Music Source Separation with Band-split RNN [25.578400006180527]
本稿では,周波数領域モデルを提案する。このモデルでは,混合物のスペクトルをサブバンドに分割し,インターリーブバンドレベルおよびシーケンスレベルのモデリングを行う。
サブバンドの帯域幅の選択は、対象源の特性に関する事前知識または専門知識によって決定できる。
実験の結果、BSRNNはMUSDB18-HQデータセットのみをトレーニングし、ミュージック・デミキシング(MDX)チャレンジ2021において、いくつかの上位モデルを上回った。
論文 参考訳(メタデータ) (2022-09-30T01:49:52Z) - Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution
Detection [55.028065567756066]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイすることの重要性から、マシンラーニングコミュニティから注目を集めている。
本稿では,特徴量の分布をモデル化した不確実な定量化手法を提案する。
バッチアンサンブルニューラルネットワーク(BE-SNN)の構築と機能崩壊問題の克服を目的として,効率的なアンサンブル機構,すなわちバッチアンサンブルを組み込んだ。
We show that BE-SNNs yield superior performance on the Two-Moons dataset, the FashionMNIST vs MNIST dataset, FashionM。
論文 参考訳(メタデータ) (2022-06-26T16:00:22Z) - Self-Learning for Received Signal Strength Map Reconstruction with
Neural Architecture Search [63.39818029362661]
ニューラルアーキテクチャサーチ(NAS)と受信信号強度(RSS)マップ再構築のための自己学習に基づくモデルを提案する。
このアプローチは、まず最適なNNアーキテクチャを見つけ、与えられた(RSS)マップの地上実測値に対して同時に推論モデルを訓練する。
実験結果から,この第2モデルの信号予測は,非学習に基づく最先端技術や,アーキテクチャ探索を伴わないNNモデルよりも優れていた。
論文 参考訳(メタデータ) (2021-05-17T12:19:22Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Statistical model-based evaluation of neural networks [74.10854783437351]
ニューラルネットワーク(NN)の評価のための実験装置を開発する。
このセットアップは、NNs vis-a-vis minimum-mean-square-error (MMSE)パフォーマンス境界のベンチマークに役立つ。
これにより、トレーニングデータサイズ、データ次元、データ幾何学、ノイズ、トレーニング条件とテスト条件のミスマッチの影響をテストできます。
論文 参考訳(メタデータ) (2020-11-18T00:33:24Z) - Deep Time Delay Neural Network for Speech Enhancement with Full Data
Learning [60.20150317299749]
本稿では,全データ学習による音声強調のためのディープタイム遅延ニューラルネットワーク(TDNN)を提案する。
トレーニングデータを完全に活用するために,音声強調のための完全なデータ学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-11T06:32:37Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。