論文の概要: Drum-Aware Ensemble Architecture for Improved Joint Musical Beat and
Downbeat Tracking
- arxiv url: http://arxiv.org/abs/2106.08685v1
- Date: Wed, 16 Jun 2021 10:47:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-17 17:07:23.132780
- Title: Drum-Aware Ensemble Architecture for Improved Joint Musical Beat and
Downbeat Tracking
- Title(参考訳): ドラムアウェアアンサンブルによる楽音とダウンビート追跡の改善
- Authors: Ching-Yu Chiu, Alvin Wen-Yu Su, and Yi-Hsuan Yang
- Abstract要約: 本稿では,音楽信号におけるブラインド音源分離とジョイントビートとダウンビート追跡を統合した新しいシステムアーキテクチャを提案する。
ソース分離モジュールは、入力信号のパーカッシブ成分と非パーカッシブ成分を分離する。
このシステムは、入力信号のトラッキング結果が入力のパーカッシブ成分や非パーカッシブ成分にどの程度依存するかを適応的に決定することができる。
- 参考スコア(独自算出の注目度): 27.7941666329557
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a novel system architecture that integrates blind source
separation with joint beat and downbeat tracking in musical audio signals. The
source separation module segregates the percussive and non-percussive
components of the input signal, over which beat and downbeat tracking are
performed separately and then the results are aggregated with a learnable
fusion mechanism. This way, the system can adaptively determine how much the
tracking result for an input signal should depend on the input's percussive or
non-percussive components. Evaluation on four testing sets that feature
different levels of presence of drum sounds shows that the new architecture
consistently outperforms the widely-adopted baseline architecture that does not
employ source separation.
- Abstract(参考訳): 本稿では,音楽信号におけるブラインド音源分離とジョイントビートとダウンビート追跡を統合した新しいシステムアーキテクチャを提案する。
ソース分離モジュールは、ビートとダウンビート追跡を別々に行う入力信号のパーカッシブ成分と非パーカッシブ成分とを分離し、学習可能な融合機構で結果を集約する。
このようにして、システムは入力信号のトラッキング結果が入力のパーカッシブ成分や非パーカッシブ成分に依存するかどうかを適応的に決定できる。
ドラム音の存在レベルが異なる4つのテストセットの評価は、新しいアーキテクチャがソース分離を使用しない広く採用されているベースラインアーキテクチャを一貫して上回っていることを示している。
関連論文リスト
- An Ensemble Approach to Music Source Separation: A Comparative Analysis of Conventional and Hierarchical Stem Separation [0.4893345190925179]
音源分離(英: Music Source separation、MSS)とは、音源を混合した音声信号から分離する作業である。
本稿では,複数の最先端アーキテクチャを組み合わせたMSSのアンサンブル手法を提案する。
論文 参考訳(メタデータ) (2024-10-28T06:18:12Z) - A Stem-Agnostic Single-Decoder System for Music Source Separation Beyond Four Stems [53.30852012059025]
Banquetは1つのデコーダを使って複数の幹のソース分離を可能にするシステムである。
バンドスプリットソース分離モデルは、楽器認識PaSSTモデルと共にタンデムでクエリベースのセットアップで動作するように拡張される。
論文 参考訳(メタデータ) (2024-06-26T20:25:53Z) - DiffMoog: a Differentiable Modular Synthesizer for Sound Matching [48.33168531500444]
DiffMoogはモジュラーシンセサイザーで、一般に商用機器で見られるモジュールの集合を包含する。
差別化が可能であるため、ニューラルネットワークとの統合が可能になり、自動サウンドマッチングが可能になる。
我々はDiffMoogとエンドツーエンドのサウンドマッチングフレームワークを組み合わせたオープンソースのプラットフォームを紹介した。
論文 参考訳(メタデータ) (2024-01-23T08:59:21Z) - High-Quality Visually-Guided Sound Separation from Diverse Categories [56.92841782969847]
DAVISは拡散に基づくオーディオ視覚分離フレームワークである。
分離された音をガウス雑音から直接合成し、オーディオミックスと視覚情報の両方に条件付けする。
AVEおよびMUSICデータセット上で,DAVISを既存の最先端の識別的音声視覚分離法と比較した。
論文 参考訳(メタデータ) (2023-07-31T19:41:49Z) - Benchmarks and leaderboards for sound demixing tasks [44.99833362998488]
音源分離タスクのための2つの新しいベンチマークを導入する。
これらのベンチマークでは、音のデミックスやアンサンブルなどの人気モデルを比較します。
また,特定の茎に最適な異なるモデルのアンサンブルに基づく,音声分離のための新しいアプローチも開発している。
論文 参考訳(メタデータ) (2023-05-12T14:00:26Z) - Transcription Is All You Need: Learning to Separate Musical Mixtures
with Score as Supervision [42.029811695104385]
音源分離システムのトレーニングには音楽スコアを弱いラベルとして使用する。
我々のシステムは独立した情報源を必要とせず、スコアはトレーニング対象としてのみ使用され、推論には必要ではない。
論文 参考訳(メタデータ) (2020-10-22T17:38:40Z) - Multitask learning for instrument activation aware music source
separation [83.30944624666839]
本稿では,楽器のアクティベーション情報を用いて音源分離性能を向上させるための新しいマルチタスク構造を提案する。
MUSDBデータセットに含まれる3つの楽器よりも現実的なシナリオである6つの独立した楽器について,本システムについて検討する。
その結果,提案したマルチタスクモデルは,Mixing SecretsとMedleyDBデータセットを混合したベースラインのOpen-Unmixモデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-08-03T02:35:00Z) - Vector-Quantized Timbre Representation [53.828476137089325]
本稿では, スペクトル特性の近似分解を生成的特徴の集合で学習することにより, 個々の音色をより柔軟に合成することを目的とする。
音量分布の量子化表現を学習するために、大音量から切り離された離散潜在空間を持つオートエンコーダを導入する。
オーケストラ楽器と歌唱音声間の音声の翻訳結果と、ボーカルの模倣音から楽器への変換結果について詳述する。
論文 参考訳(メタデータ) (2020-07-13T12:35:45Z) - Optimal Learning with Excitatory and Inhibitory synapses [91.3755431537592]
相関関係の存在下でアナログ信号間の関連性を保持するという課題について検討する。
ランダムな入力および出力プロセスのパワースペクトルの観点から、典型的な学習性能を特徴付ける。
論文 参考訳(メタデータ) (2020-05-25T18:25:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。