論文の概要: Brazilian Lyrics-Based Music Genre Classification Using a BLSTM Network
- arxiv url: http://arxiv.org/abs/2003.05377v1
- Date: Fri, 6 Mar 2020 05:39:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 00:26:58.199833
- Title: Brazilian Lyrics-Based Music Genre Classification Using a BLSTM Network
- Title(参考訳): BLSTMネットワークを用いたブラジルの歌詞に基づく音楽ジャンル分類
- Authors: Raul de Ara\'ujo Lima, R\^omulo C\'esar Costa de Sousa, Simone Diniz
Junqueira Barbosa, H\'elio Cort\^es Vieira Lopes
- Abstract要約: 本稿では,ブラジルの音楽ジャンルの自動分類に,歌詞のみを用いた新しいアプローチを提案する。
ブラジルの14のジャンルに分布する138,368の歌詞のデータセットを構築した。
ゴスペル」や「ファンク・カリオカ」や「セルタネホ」といったジャンルは最も区別されやすく分類しやすいものとして定義できる。
- 参考スコア(独自算出の注目度): 1.9116784879310027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Organize songs, albums, and artists in groups with shared similarity could be
done with the help of genre labels. In this paper, we present a novel approach
for automatic classifying musical genre in Brazilian music using only the song
lyrics. This kind of classification remains a challenge in the field of Natural
Language Processing. We construct a dataset of 138,368 Brazilian song lyrics
distributed in 14 genres. We apply SVM, Random Forest and a Bidirectional Long
Short-Term Memory (BLSTM) network combined with different word embeddings
techniques to address this classification task. Our experiments show that the
BLSTM method outperforms the other models with an F1-score average of $0.48$.
Some genres like "gospel", "funk-carioca" and "sertanejo", which obtained 0.89,
0.70 and 0.69 of F1-score, respectively, can be defined as the most distinct
and easy to classify in the Brazilian musical genres context.
- Abstract(参考訳): 楽曲、アルバム、アーティストを共通の類似性を持つグループで整理することは、ジャンルレーベルの助けを借りて行うことができる。
本稿では,ブラジルの音楽ジャンルの自動分類に,歌詞のみを用いた新しいアプローチを提案する。
この種の分類は、自然言語処理の分野で依然として課題である。
14ジャンルのブラジルの歌詞138,368のデータセットを構築した。
本稿では,SVM,ランダムフォレスト,双方向長短期記憶(BLSTM)ネットワークと単語埋め込み技術を組み合わせて,この分類課題に対処する。
実験の結果, BLSTM法はF1スコア平均0.48$で他のモデルよりも優れていた。
F1スコアの0.89、0.70、0.69をそれぞれ獲得した「ゴスペル」や「ファンク・カリオカ」や「セルタネホ」といったジャンルは、ブラジルの音楽ジャンルの文脈において最も区別され易いものとして定義することができる。
関連論文リスト
- CLaMP 2: Multimodal Music Information Retrieval Across 101 Languages Using Large Language Models [51.03510073676228]
CLaMP 2は、音楽情報検索用の101言語に対応するシステムである。
大規模言語モデルを活用することで,大規模に洗練され一貫した多言語記述が得られる。
CLaMP 2は、多言語セマンティックサーチとモーダル間の音楽分類において、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-17T06:43:54Z) - Optimizing the Songwriting Process: Genre-Based Lyric Generation Using Deep Learning Models [2.703659575788133]
本プロジェクトは,ディープラーニング技術を用いて,従来の曲の書き起こしプロセスを簡素化することを目的としている。
我々は、歌詞を個々の詩にパースするためにトークンを用いた独自の前処理フォーマットを開発した。
その結果, ベースラインモデルでは高いリコール(ROUGE)が得られたが, どちらのモデルにも類似の精度(BLEU)が得られた。
論文 参考訳(メタデータ) (2024-09-15T21:32:46Z) - ChatMusician: Understanding and Generating Music Intrinsically with LLM [81.48629006702409]
ChatMusicianは、固有の音楽能力を統合するオープンソースのLarge Language Models(LLM)である。
外部のマルチモーダル・ニューラル構造やトークンーザを使わずに、純粋なテキスト・トークンーザで音楽を理解して生成することができる。
我々のモデルは、テキスト、コード、メロディ、モチーフ、音楽形式など、よく構造化されたフル長の音楽を構成することができる。
論文 参考訳(メタデータ) (2024-02-25T17:19:41Z) - LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT [48.28624219567131]
リリックウィズ(LyricWhiz)は、頑健で、多言語で、ゼロショットの自動歌詞書き起こし方式である。
我々は、弱教師付き頑健な音声認識モデルであるWhisperと、今日の最もパフォーマンスの高いチャットベースの大規模言語モデルであるGPT-4を使用している。
実験の結果,LyricWhizは英語の既存手法に比べて単語誤り率を大幅に低下させることがわかった。
論文 参考訳(メタデータ) (2023-06-29T17:01:51Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z) - Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics [0.0]
Spotifyから収集したTeluguの歌詞を手動で注釈付けしたデータセットを提示する。
2つの分類手法を用いて2つの音楽感情認識モデルを作成する。
データセットを、歌詞、アノテーション、Spotify IDで公開しています。
論文 参考訳(メタデータ) (2023-03-16T14:47:52Z) - Re-creation of Creations: A New Paradigm for Lyric-to-Melody Generation [158.54649047794794]
Re-creation of Creations (ROC)は、歌詞からメロディ生成のための新しいパラダイムである。
ROCは、Lyric-to-Meody生成において、優れたLyric-Meody特徴アライメントを実現する。
論文 参考訳(メタデータ) (2022-08-11T08:44:47Z) - Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of
Polyphonic Music [73.73045854068384]
本稿では,新ジャンルネットワークを用いたポリフォニック音楽の歌詞の書き起こしを提案する。
提案するネットワークは,事前学習されたモデルパラメータを採用し,階層間のジャンルアダプタを組み込んで,歌詞とジャンルのペアのジャンルの特色を抽出する。
実験の結果,提案するジャンル条件付きネットワークは既存の歌詞の書き起こしシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-04-07T09:15:46Z) - Complex Network-Based Approach for Feature Extraction and Classification
of Musical Genres [0.0]
本研究は,音楽ジャンルの自動分類のための特徴抽出手法を提案する。
提案手法はまずまず音符の列に変換し,その列を複雑なネットワークとしてマッピングする。
音楽ジャンルの分類に適用可能な特徴ベクトルを構成するネットワークトポロジを特徴付けるために、トポロジ測定を抽出する。
論文 参考訳(メタデータ) (2021-10-09T22:23:33Z) - Multilingual Music Genre Embeddings for Effective Cross-Lingual Music
Item Annotation [9.709229853995987]
言語間音楽ジャンルの翻訳は、並列コーパスに頼ることなく可能である。
多言語音楽ジャンルの埋め込みを学習することにより、並列コーパスに頼ることなく、多言語音楽ジャンルの翻訳を可能にする。
本手法は,複数の言語におけるタグシステム間の楽曲ジャンルの翻訳に有効である。
論文 参考訳(メタデータ) (2020-09-16T15:39:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。