論文の概要: A Data-Driven Methodology for Considering Feasibility and Pairwise
Likelihood in Deep Learning Based Guitar Tablature Transcription Systems
- arxiv url: http://arxiv.org/abs/2204.08094v1
- Date: Sun, 17 Apr 2022 22:10:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 01:12:18.907851
- Title: A Data-Driven Methodology for Considering Feasibility and Pairwise
Likelihood in Deep Learning Based Guitar Tablature Transcription Systems
- Title(参考訳): 深層学習に基づくギター表層転写システムにおける実現可能性とペアワイズ可能性を考慮したデータ駆動手法
- Authors: Frank Cwitkowitz, Jonathan Driedger, Zhiyao Duan
- Abstract要約: この作品では、シンボリック・タブラチュアを利用して、ギターの音符のペアの確率を推定する。
ベースライン表象転写モデルの出力層を再構成し、阻害損失を組み込むことで、不可能なノートペアの共活性化を防止できる。
これは自然にギターの演奏性制約を強制し、ペアの確率を推定するために使用されるシンボリックデータとより整合したタブラを与える。
- 参考スコア(独自算出の注目度): 18.247508110198698
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Guitar tablature transcription is an important but understudied problem
within the field of music information retrieval. Traditional signal processing
approaches offer only limited performance on the task, and there is little
acoustic data with transcription labels for training machine learning models.
However, guitar transcription labels alone are more widely available in the
form of tablature, which is commonly shared among guitarists online. In this
work, a collection of symbolic tablature is leveraged to estimate the pairwise
likelihood of notes on the guitar. The output layer of a baseline tablature
transcription model is reformulated, such that an inhibition loss can be
incorporated to discourage the co-activation of unlikely note pairs. This
naturally enforces playability constraints for guitar, and yields tablature
which is more consistent with the symbolic data used to estimate pairwise
likelihoods. With this methodology, we show that symbolic tablature can be used
to shape the distribution of a tablature transcription model's predictions,
even when little acoustic data is available.
- Abstract(参考訳): ギターの表層転写は音楽情報検索の分野において重要な問題であるが未検討の課題である。
従来の信号処理アプローチでは、タスクのパフォーマンスは限定的であり、機械学習モデルをトレーニングするための書き起こしラベルを持つ音響データはほとんどない。
しかし、ギターの書き起こしラベルだけでは、オンラインのギタリストの間で共有されるタブーという形でより広く利用することができる。
この研究では、シンボリック・タブラチュアのコレクションを利用して、ギターの音符のペアの確率を推定する。
ベースラインタブラチュール転写モデルの出力層を再構成し、ありそうにない音対の共活性化を阻害するために抑制損失を組み込むことができる。
これは自然にギターの演奏性制約を強制し、ペアの確率を推定するために使用されるシンボリックデータとより整合したタブラを与える。
本手法では, 音響データが少ない場合でも, 記号的表計算を用いて, 表計算モデルの予測の分布を形作ることができることを示す。
関連論文リスト
- TapToTab : Video-Based Guitar Tabs Generation using AI and Audio Analysis [0.0]
本稿では,ディープラーニング,特にリアルタイムフレットボード検出のためのYOLOモデルを活用した高度なアプローチを提案する。
実験の結果,従来の手法に比べて検出精度とロバスト性は著しく向上した。
本稿では,ビデオ録音からギタータブを自動生成することで,ギター指導に革命をもたらすことを目的とする。
論文 参考訳(メタデータ) (2024-09-13T08:17:15Z) - MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling [6.150307957212576]
シンボリックギターのタブリング推定のための新しいディープラーニングソリューションを提案する。
我々は、文字列に音符を割り当てるために、マスク付き言語モデリングパラダイムでエンコーダ・デコーダ変換モデルを訓練する。
このモデルは、まず25K以上のタブチュアのデータセットであるDadaGPで事前トレーニングされ、その後、プロが書き起こしたギター演奏のキュレートセットで微調整される。
論文 参考訳(メタデータ) (2024-08-09T12:25:23Z) - Unlocking the Transferability of Tokens in Deep Models for Tabular Data [67.11727608815636]
トレーニング済みのディープニューラルネットワークの微調整は、さまざまな機械学習タスクにおいて成功しているパラダイムとなっている。
本稿では,特徴トークンの品質向上を目的としたTabTokenを提案する。
トークンを規則化し、機能内および機能間のセマンティクスをキャプチャする、対照的な目的を導入します。
論文 参考訳(メタデータ) (2023-10-23T17:53:09Z) - Modeling Bends in Popular Music Guitar Tablatures [49.64902130083662]
タブラチュア表記はポピュラー音楽で広く使われ、ギター音楽のコンテンツの書き起こしや共有に使われている。
本論文は,音符のピッチを段階的にシフトできる屈曲に着目し,離散的な指板の物理的制限を回避する。
ポピュラー音楽の932個のリードギタータブラのコーパス上で実験を行い、決定木がF1スコア0.71と限られた偽陽性予測量で屈曲の発生をうまく予測することを示す。
論文 参考訳(メタデータ) (2023-08-22T07:50:58Z) - GTR-CTRL: Instrument and Genre Conditioning for Guitar-Focused Music
Generation with Transformers [14.025337055088102]
ギタータブ音楽生成にはDadaGPデータセット,GuitarProでは26万曲以上のコーパス,トークンフォーマットなどを用いています。
所望の楽器やジャンルに基づいてギタータブを生成するために,Transformer-XLディープラーニングモデルを条件付ける手法を提案する。
その結果、GTR-CTRL法は、無条件モデルよりもギター中心のシンボリック・ミュージック・ジェネレーションの柔軟性と制御性が高いことが示唆された。
論文 参考訳(メタデータ) (2023-02-10T17:43:03Z) - Semi-Supervised Semantic Segmentation via Gentle Teaching Assistant [72.4512562104361]
擬似ラベル付きラベル付きラベル付きデータは,特徴抽出器における代表的特徴の学習を容易にすることができると論じる。
そこで本研究では,擬似ラベルが特徴抽出器やマスク予測器に与える影響を解消する新しい枠組みであるジェントル指導アシスタント(GTA-Seg)を提案する。
論文 参考訳(メタデータ) (2023-01-18T07:11:24Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - Unaligned Supervision For Automatic Music Transcription in The Wild [1.2183405753834562]
NoteEMは、トランクレーバーを同時に訓練し、スコアを対応するパフォーマンスに合わせる方法である。
我々は、MAPSデータセットのSOTAノートレベル精度と、データセット間の評価において好適なマージンを報告した。
論文 参考訳(メタデータ) (2022-04-28T17:31:43Z) - Graph Attention Transformer Network for Multi-Label Image Classification [50.0297353509294]
複雑なラベル間関係を効果的にマイニングできる多ラベル画像分類のための一般的なフレームワークを提案する。
提案手法は3つのデータセット上で最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2022-03-08T12:39:05Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。