論文の概要: MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling
- arxiv url: http://arxiv.org/abs/2408.05024v1
- Date: Fri, 9 Aug 2024 12:25:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-12 15:56:59.506782
- Title: MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling
- Title(参考訳): MIDI-to-Tab:マスク言語モデリングによるギタータブラチュア推論
- Authors: Drew Edwards, Xavier Riley, Pedro Sarmento, Simon Dixon,
- Abstract要約: シンボリックギターのタブリング推定のための新しいディープラーニングソリューションを提案する。
我々は、文字列に音符を割り当てるために、マスク付き言語モデリングパラダイムでエンコーダ・デコーダ変換モデルを訓練する。
このモデルは、まず25K以上のタブチュアのデータセットであるDadaGPで事前トレーニングされ、その後、プロが書き起こしたギター演奏のキュレートセットで微調整される。
- 参考スコア(独自算出の注目度): 6.150307957212576
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Guitar tablatures enrich the structure of traditional music notation by assigning each note to a string and fret of a guitar in a particular tuning, indicating precisely where to play the note on the instrument. The problem of generating tablature from a symbolic music representation involves inferring this string and fret assignment per note across an entire composition or performance. On the guitar, multiple string-fret assignments are possible for most pitches, which leads to a large combinatorial space that prevents exhaustive search approaches. Most modern methods use constraint-based dynamic programming to minimize some cost function (e.g.\ hand position movement). In this work, we introduce a novel deep learning solution to symbolic guitar tablature estimation. We train an encoder-decoder Transformer model in a masked language modeling paradigm to assign notes to strings. The model is first pre-trained on DadaGP, a dataset of over 25K tablatures, and then fine-tuned on a curated set of professionally transcribed guitar performances. Given the subjective nature of assessing tablature quality, we conduct a user study amongst guitarists, wherein we ask participants to rate the playability of multiple versions of tablature for the same four-bar excerpt. The results indicate our system significantly outperforms competing algorithms.
- Abstract(参考訳): ギター・タブラチュアは、特定のチューニングにおいて、ギターの弦とフレットに各音符を割り当て、楽器の音符をどこで演奏するかを正確に示すことによって、伝統的な音楽表記の構造を充実させる。
シンボリックな音楽表現から表象を生成する問題は、この文字列と音符毎のフレット代入を作曲や演奏全体にわたって推測することである。
ギターでは、ほとんどのピッチに対して複数の文字列フリート割り当てが可能であるため、徹底的な探索アプローチを阻害する大きな組合せ空間が生じる。
現代のほとんどの手法は制約に基づく動的プログラミングを使ってコスト関数を最小化している(例えば手の位置運動)。
本研究では,シンボリックギターのタブラ推定のための新しい深層学習手法を提案する。
我々は、文字列に音符を割り当てるために、マスク付き言語モデリングパラダイムでエンコーダ・デコーダ変換モデルを訓練する。
このモデルは、まず25K以上のタブチュアのデータセットであるDadaGPで事前トレーニングされ、その後、プロが書き起こしたギター演奏のキュレートセットで微調整される。
タブラチュアの質を評価する主観的な性質を考慮し、ギタリスト間のユーザスタディを行い、同じ4バーの抜粋に対して複数バージョンのタブラチュアの演奏性を評価する。
その結果,本システムは競合するアルゴリズムよりも優れていた。
関連論文リスト
- Guitar Chord Diagram Suggestion for Western Popular Music [43.58572466488356]
コードダイアグラムは、ギター奏者がフレットボードでコードを演奏する場所と方法を示すために使用される。
いくつかのコードダイアグラムは西洋のポピュラー音楽で過剰に表現されており、いくつかのコードダイアグラムは20以上の方法で演奏可能であることを示す。
コンテクストを考慮に入れれば、コードダイアグラムの提案の多様性や質が向上し、現在のコードラベルのみを考慮に入れたモデルと比較する。
論文 参考訳(メタデータ) (2024-07-15T07:44:13Z) - From MIDI to Rich Tablatures: an Automatic Generative System incorporating Lead Guitarists' Fingering and Stylistic choices [42.362388367152256]
簡単なMIDIメロディから,指や調音,表現技術に富んだタブを生成できるシステムを提案する。
提案手法の質と高い構成性はいくつかの影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2024-07-12T07:18:24Z) - Modeling Bends in Popular Music Guitar Tablatures [49.64902130083662]
タブラチュア表記はポピュラー音楽で広く使われ、ギター音楽のコンテンツの書き起こしや共有に使われている。
本論文は,音符のピッチを段階的にシフトできる屈曲に着目し,離散的な指板の物理的制限を回避する。
ポピュラー音楽の932個のリードギタータブラのコーパス上で実験を行い、決定木がF1スコア0.71と限られた偽陽性予測量で屈曲の発生をうまく予測することを示す。
論文 参考訳(メタデータ) (2023-08-22T07:50:58Z) - GTR-CTRL: Instrument and Genre Conditioning for Guitar-Focused Music
Generation with Transformers [14.025337055088102]
ギタータブ音楽生成にはDadaGPデータセット,GuitarProでは26万曲以上のコーパス,トークンフォーマットなどを用いています。
所望の楽器やジャンルに基づいてギタータブを生成するために,Transformer-XLディープラーニングモデルを条件付ける手法を提案する。
その結果、GTR-CTRL法は、無条件モデルよりもギター中心のシンボリック・ミュージック・ジェネレーションの柔軟性と制御性が高いことが示唆された。
論文 参考訳(メタデータ) (2023-02-10T17:43:03Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music
Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。
テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。
実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文 参考訳(メタデータ) (2022-11-21T07:19:17Z) - A Data-Driven Methodology for Considering Feasibility and Pairwise
Likelihood in Deep Learning Based Guitar Tablature Transcription Systems [18.247508110198698]
この作品では、シンボリック・タブラチュアを利用して、ギターの音符のペアの確率を推定する。
ベースライン表象転写モデルの出力層を再構成し、阻害損失を組み込むことで、不可能なノートペアの共活性化を防止できる。
これは自然にギターの演奏性制約を強制し、ペアの確率を推定するために使用されるシンボリックデータとより整合したタブラを与える。
論文 参考訳(メタデータ) (2022-04-17T22:10:37Z) - Music Gesture for Visual Sound Separation [121.36275456396075]
ミュージック・ジェスチャ(Music Gesture)は、音楽演奏時の演奏者の身体と指の動きを明示的にモデル化するキーポイントに基づく構造化表現である。
まず、コンテキスト対応グラフネットワークを用いて、視覚的コンテキストと身体力学を統合し、その後、身体の動きと対応する音声信号とを関連付けるために、音声-視覚融合モデルを適用する。
論文 参考訳(メタデータ) (2020-04-20T17:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。