論文の概要: Lyric document embeddings for music tagging
- arxiv url: http://arxiv.org/abs/2112.11436v1
- Date: Mon, 29 Nov 2021 11:02:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-26 13:17:20.845819
- Title: Lyric document embeddings for music tagging
- Title(参考訳): 音楽タギングのための歌詞文書埋め込み
- Authors: Matt McVicar, Bruno Di Giorgi, Baris Dundar, Matthias Mauch
- Abstract要約: 本研究では,音楽タギングを目的とした楽曲の歌詞を定次元的特徴に組み込む実験的検討を行った。
数千万曲の産業規模データセット上で,トークンレベルと文書レベル表現の5つの計算方法と4つの計算方法が訓練されている。
平均的な単語埋め込みは、多くの下流のメトリクスにおいて、より複雑なアーキテクチャよりも優れています。
- 参考スコア(独自算出の注目度): 0.38233569758620045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an empirical study on embedding the lyrics of a song into a
fixed-dimensional feature for the purpose of music tagging. Five methods of
computing token-level and four methods of computing document-level
representations are trained on an industrial-scale dataset of tens of millions
of songs. We compare simple averaging of pretrained embeddings to modern
recurrent and attention-based neural architectures. Evaluating on a wide range
of tagging tasks such as genre classification, explicit content identification
and era detection, we find that averaging word embeddings outperform more
complex architectures in many downstream metrics.
- Abstract(参考訳): 本研究では,楽曲の歌詞を音楽タグ付けのための固定次元特徴に組み込む実験的検討を行った。
数千万曲の産業規模データセット上で,トークンレベルと文書レベル表現の5つの計算方法と4つの計算方法を訓練する。
プレトレーニング済み埋め込みの簡単な平均化と、現代の繰り返しおよび注意に基づくニューラルアーキテクチャを比較した。
ジャンル分類や明示的コンテンツ識別,年代検出など,幅広いタグ付けタスクを評価した結果,平均的な単語埋め込みは下流の多くのメトリクスにおいて,より複雑なアーキテクチャよりも優れていることがわかった。
関連論文リスト
- Optical Music Recognition in Manuscripts from the Ricordi Archive [6.274767633959002]
リコルディのアーカイブは、ドニゼッティ、ヴェルディ、プッチーニといった著名なオペラ作曲家の著名な音楽写本のコレクションであり、デジタル化されている。
我々は,ノート,ステーブ,クリーフ,消去,作曲家の注釈など,写本に描かれた様々な音楽要素を表すサンプルを自動的に抽出した。
我々は、識別された音楽要素を区別するために、複数のニューラルネットワークベースの分類器を訓練した。
論文 参考訳(メタデータ) (2024-08-14T09:29:11Z) - Towards Explainable and Interpretable Musical Difficulty Estimation: A Parameter-efficient Approach [49.2787113554916]
音楽コレクションの整理には曲の難易度を推定することが重要である。
シンボリックな音楽表現の難易度推定には説明可能な記述子を用いる。
ピアノレパートリーで評価したアプローチは,平均2乗誤差(MSE)が1.7。
論文 参考訳(メタデータ) (2024-08-01T11:23:42Z) - Detecting Synthetic Lyrics with Few-Shot Inference [5.448536338411993]
高品質な合成歌詞の最初のデータセットをキュレートした。
LLM2Vecをベースとした、最も優れた数発の検出器は、スタイリスティックおよび統計的手法を超越しています。
本研究は,創造的コンテンツ検出のさらなる研究の必要性を強調する。
論文 参考訳(メタデータ) (2024-06-21T15:19:21Z) - Music-to-Text Synaesthesia: Generating Descriptive Text from Music
Recordings [36.090928638883454]
音楽からテキストへの合成は、音楽録音から記述的なテキストを同じ感情で生成し、さらに理解することを目的としている。
音楽録音の内容を記述可能な文を生成するための計算モデルを構築した。
非差別的なクラシック音楽に対処するために,グループトポロジ保存損失を設計する。
論文 参考訳(メタデータ) (2022-10-02T06:06:55Z) - LeQua@CLEF2022: Learning to Quantify [76.22817970624875]
LeQua 2022は、テキストデータセットで'を定量化する方法を評価するための新しい実験室である。
本研究の目的は、バイナリ設定とシングルラベルのマルチクラス設定の両方において、学習方法の比較評価のための設定を提供することである。
論文 参考訳(メタデータ) (2021-11-22T14:54:20Z) - Multi-task Learning with Metadata for Music Mood Classification [0.0]
ムード認識は音楽情報学において重要な問題であり、音楽発見とレコメンデーションに重要な応用がある。
マルチタスク学習手法を提案する。この手法では、共有されたモデルが、気分やメタデータの予測タスクに対して同時に訓練される。
我々の手法を既存の最先端の畳み込みニューラルネットワークに適用することにより、その性能を継続的に改善する。
論文 参考訳(メタデータ) (2021-10-10T11:36:34Z) - Complex Network-Based Approach for Feature Extraction and Classification
of Musical Genres [0.0]
本研究は,音楽ジャンルの自動分類のための特徴抽出手法を提案する。
提案手法はまずまず音符の列に変換し,その列を複雑なネットワークとしてマッピングする。
音楽ジャンルの分類に適用可能な特徴ベクトルを構成するネットワークトポロジを特徴付けるために、トポロジ測定を抽出する。
論文 参考訳(メタデータ) (2021-10-09T22:23:33Z) - Larger-Context Tagging: When and Why Does It Work? [55.407651696813396]
一般的な戦略として、より大規模なコンテキストトレーニングがいつ、なぜ機能するのかを調査することに注力する。
4つのタグ付けタスクと13のデータセットに基づいてテストベッドを設定しました。
論文 参考訳(メタデータ) (2021-04-09T15:35:30Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z) - Deep Learning Based Text Classification: A Comprehensive Review [75.8403533775179]
本稿では,近年開発されたテキスト分類のための150以上のディープラーニングモデルについてレビューする。
また、テキスト分類に広く使われている40以上の一般的なデータセットの要約も提供する。
論文 参考訳(メタデータ) (2020-04-06T02:00:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。