論文の概要: Revisiting Meter Tracking in Carnatic Music using Deep Learning Approaches
- arxiv url: http://arxiv.org/abs/2509.11241v1
- Date: Sun, 14 Sep 2025 12:33:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:22.991604
- Title: Revisiting Meter Tracking in Carnatic Music using Deep Learning Approaches
- Title(参考訳): ディープラーニングアプローチによるカルネティック・ミュージックにおけるメートル追跡の再検討
- Authors: Satyajeet Prabhu,
- Abstract要約: 距離追跡は音楽情報検索(MIR)の基本課題である
ディープラーニングモデルは、この領域における従来の信号処理と古典的な機械学習アプローチをはるかに上回っている。
本研究では,カルナティック音楽におけるメータートラッキングの2つのモデルを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Beat and downbeat tracking, jointly referred to as Meter Tracking, is a fundamental task in Music Information Retrieval (MIR). Deep learning models have far surpassed traditional signal processing and classical machine learning approaches in this domain, particularly for Western (Eurogenetic) genres, where large annotated datasets are widely available. These systems, however, perform less reliably on underrepresented musical traditions. Carnatic music, a rich tradition from the Indian subcontinent, is renowned for its rhythmic intricacy and unique metrical structures (t\=alas). The most notable prior work on meter tracking in this context employed probabilistic Dynamic Bayesian Networks (DBNs). The performance of state-of-the-art (SOTA) deep learning models on Carnatic music, however, remains largely unexplored. In this study, we evaluate two models for meter tracking in Carnatic music: the Temporal Convolutional Network (TCN), a lightweight architecture that has been successfully adapted for Latin rhythms, and Beat This!, a transformer-based model designed for broad stylistic coverage without the need for post-processing. Replicating the experimental setup of the DBN baseline on the Carnatic Music Rhythm (CMR$_f$) dataset, we systematically assess the performance of these models in a directly comparable setting. We further investigate adaptation strategies, including fine-tuning the models on Carnatic data and the use of musically informed parameters. Results show that while off-the-shelf models do not always outperform the DBN, their performance improves substantially with transfer learning, matching or surpassing the baseline. These findings indicate that SOTA deep learning models can be effectively adapted to underrepresented traditions, paving the way for more inclusive and broadly applicable meter tracking systems.
- Abstract(参考訳): ビート・アンド・ダウンビート追跡(ビート・アンド・ダウンビート・トラッキング)は、音楽情報検索(MIR)の基本課題である。
ディープラーニングモデルは、この領域の伝統的な信号処理や古典的な機械学習アプローチをはるかに超えており、特に大規模な注釈付きデータセットが広く利用可能である西洋(エウロジェネティック)のジャンルにおいてである。
しかし、これらのシステムは、あまり表現されていない音楽の伝統において、信頼性が低い。
インド亜大陸からの豊かな伝統であるカルナティック音楽は、そのリズム的な複雑さとユニークなメートル法構造(t\=alas)で有名である。
この文脈におけるメータートラッキングに関する最も顕著な先行研究は、確率論的動的ベイズネットワーク(DBN)を用いていた。
しかし、カルナティック音楽における最先端の深層学習モデル(SOTA)の性能は、明らかにされていない。
本研究では,ラテンリズムに適応した軽量アーキテクチャであるTCN(Temporal Convolutional Network)と,ポストプロセッシングを必要とせずに広いスタイリスティックなカバーを設計したBeat This!の2つのモデルを評価する。
CMR$_f$(Carnatic Music Rhythm)データセット上のDBNベースラインの実験的なセットアップを再現し、これらのモデルの性能を直接的に比較して体系的に評価する。
さらに、カルナティックデータ上でのモデルの微調整や、音楽的にインフォメーションされたパラメータの使用など、適応戦略についても検討する。
その結果, 既成モデルがDBNを常に上回るわけではないが, 転送学習, マッチング, あるいはベースラインを超えれば, 性能は大幅に向上することがわかった。
これらの結果から,SOTA深層学習モデルは,より包括的で広範に適用可能な計数追跡システムを実現するために,表現不足の伝統に効果的に適応できることが示唆された。
関連論文リスト
- Comparative Analysis of Pretrained Audio Representations in Music Recommender Systems [0.0]
音楽情報検索 (MIR) は大量の音楽データに基づいて事前訓練された様々なモデルを提案する。
転送学習は、下流タスクの幅広い範囲で事前訓練されたバックエンドモデルの実証された効果を示す。
Music Recommender Systemsは、事前訓練されたモデルよりも、従来のエンドツーエンドのニューラルネットワーク学習を好む傾向がある。
論文 参考訳(メタデータ) (2024-09-13T17:03:56Z) - Naturalistic Music Decoding from EEG Data via Latent Diffusion Models [14.882764251306094]
本研究は,非侵襲的脳波データを用いて,高品質な音楽再生を実現するための最初の試みである。
我々は、パブリックなNMED-Tデータセットでモデルをトレーニングし、ニューラルネットワークベースのメトリクスを提案する定量的評価を行う。
論文 参考訳(メタデータ) (2024-05-15T03:26:01Z) - MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training [74.32603591331718]
本稿では,MLMスタイルの音響事前学習において,教師モデルと擬似ラベルを組み込んだ大規模自己教師型学習(MERT)を用いた音響音楽理解モデルを提案する。
実験結果から,本モデルでは14曲の楽曲理解タスクを一般化し,性能を向上し,SOTA(State-of-the-art)全体のスコアを達成できることが示唆された。
論文 参考訳(メタデータ) (2023-05-31T18:27:43Z) - Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music
Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。
テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。
実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文 参考訳(メタデータ) (2022-11-21T07:19:17Z) - Modeling Musical Structure with Artificial Neural Networks [0.0]
音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。
Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。
本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
論文 参考訳(メタデータ) (2020-01-06T18:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。