論文の概要: Multi-label Cross-lingual automatic music genre classification from lyrics with Sentence BERT
- arxiv url: http://arxiv.org/abs/2501.03769v1
- Date: Tue, 07 Jan 2025 13:22:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-08 15:49:44.179083
- Title: Multi-label Cross-lingual automatic music genre classification from lyrics with Sentence BERT
- Title(参考訳): Sentence BERTによる歌詞からの多言語多言語自動ジャンル分類
- Authors: Tiago Fernandes Tavares, Fabio José Ayres,
- Abstract要約: 本稿では sBERT が生成した多言語文の埋め込みに基づく多言語ジャンル分類システムを提案する。
重なり合う8つのジャンルを持つバイリンガル・ポルトガル語・英語のデータセットを用いて、ある言語で歌詞を訓練し、別の言語でジャンルを予測する能力を示す。
- 参考スコア(独自算出の注目度): 0.13654846342364302
- License:
- Abstract: Music genres are shaped by both the stylistic features of songs and the cultural preferences of artists' audiences. Automatic classification of music genres using lyrics can be useful in several applications such as recommendation systems, playlist creation, and library organization. We present a multi-label, cross-lingual genre classification system based on multilingual sentence embeddings generated by sBERT. Using a bilingual Portuguese-English dataset with eight overlapping genres, we demonstrate the system's ability to train on lyrics in one language and predict genres in another. Our approach outperforms the baseline approach of translating lyrics and using a bag-of-words representation, improving the genrewise average F1-Score from 0.35 to 0.69. The classifier uses a one-vs-all architecture, enabling it to assign multiple genre labels to a single lyric. Experimental results reveal that dataset centralization notably improves cross-lingual performance. This approach offers a scalable solution for genre classification across underrepresented languages and cultural domains, advancing the capabilities of music information retrieval systems.
- Abstract(参考訳): 音楽ジャンルは、歌の様式的特徴と、芸術家の聴衆の文化的嗜好の両方によって形成されている。
歌詞を用いた音楽ジャンルの自動分類は、レコメンデーションシステム、プレイリスト作成、図書館組織など、いくつかのアプリケーションで有用である。
本稿では sBERT が生成した多言語文の埋め込みに基づく多言語ジャンル分類システムを提案する。
重なり合う8つのジャンルを持つバイリンガル・ポルトガル語・英語のデータセットを用いて、ある言語で歌詞を訓練し、別の言語でジャンルを予測する能力を示す。
本手法は、歌詞の翻訳と単語のバッグ表現のベースラインアプローチよりも優れており、ジャンル平均F1スコアを0.35から0.69に改善する。
分類器は1-vs-allアーキテクチャを使用しており、複数のジャンルのラベルを1つの歌詞に割り当てることができる。
実験の結果,データセットの集中化は言語間性能を著しく向上させることがわかった。
このアプローチは、未表現言語や文化ドメインをまたいだジャンル分類のためのスケーラブルなソリューションを提供し、音楽情報検索システムの能力を向上させる。
関連論文リスト
- CLaMP 2: Multimodal Music Information Retrieval Across 101 Languages Using Large Language Models [51.03510073676228]
CLaMP 2は、音楽情報検索用の101言語に対応するシステムである。
大規模言語モデルを活用することで,大規模に洗練され一貫した多言語記述が得られる。
CLaMP 2は、多言語セマンティックサーチとモーダル間の音楽分類において、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-10-17T06:43:54Z) - LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT [48.28624219567131]
リリックウィズ(LyricWhiz)は、頑健で、多言語で、ゼロショットの自動歌詞書き起こし方式である。
我々は、弱教師付き頑健な音声認識モデルであるWhisperと、今日の最もパフォーマンスの高いチャットベースの大規模言語モデルであるGPT-4を使用している。
実験の結果,LyricWhizは英語の既存手法に比べて単語誤り率を大幅に低下させることがわかった。
論文 参考訳(メタデータ) (2023-06-29T17:01:51Z) - Re-creation of Creations: A New Paradigm for Lyric-to-Melody Generation [158.54649047794794]
Re-creation of Creations (ROC)は、歌詞からメロディ生成のための新しいパラダイムである。
ROCは、Lyric-to-Meody生成において、優れたLyric-Meody特徴アライメントを実現する。
論文 参考訳(メタデータ) (2022-08-11T08:44:47Z) - Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of
Polyphonic Music [73.73045854068384]
本稿では,新ジャンルネットワークを用いたポリフォニック音楽の歌詞の書き起こしを提案する。
提案するネットワークは,事前学習されたモデルパラメータを採用し,階層間のジャンルアダプタを組み込んで,歌詞とジャンルのペアのジャンルの特色を抽出する。
実験の結果,提案するジャンル条件付きネットワークは既存の歌詞の書き起こしシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-04-07T09:15:46Z) - Complex Network-Based Approach for Feature Extraction and Classification
of Musical Genres [0.0]
本研究は,音楽ジャンルの自動分類のための特徴抽出手法を提案する。
提案手法はまずまず音符の列に変換し,その列を複雑なネットワークとしてマッピングする。
音楽ジャンルの分類に適用可能な特徴ベクトルを構成するネットワークトポロジを特徴付けるために、トポロジ測定を抽出する。
論文 参考訳(メタデータ) (2021-10-09T22:23:33Z) - Modeling the Music Genre Perception across Language-Bound Cultures [10.223656553455003]
本研究では,言語横断・文化特化音楽ジャンルアノテーションの実現可能性について検討する。
教師なしの言語間音楽ジャンルのアノテーションは高い精度で実現可能であることを示す。
我々は,多言語事前学習型埋め込みモデルのベンチマークを行うために,新しいドメイン依存型言語間コーパスを導入する。
論文 参考訳(メタデータ) (2020-10-13T12:20:32Z) - Multilingual Music Genre Embeddings for Effective Cross-Lingual Music
Item Annotation [9.709229853995987]
言語間音楽ジャンルの翻訳は、並列コーパスに頼ることなく可能である。
多言語音楽ジャンルの埋め込みを学習することにより、並列コーパスに頼ることなく、多言語音楽ジャンルの翻訳を可能にする。
本手法は,複数の言語におけるタグシステム間の楽曲ジャンルの翻訳に有効である。
論文 参考訳(メタデータ) (2020-09-16T15:39:04Z) - Leveraging Adversarial Training in Self-Learning for Cross-Lingual Text
Classification [52.69730591919885]
本稿では,ラベル保存型入力摂動の最大損失を最小限に抑える半教師付き対向学習法を提案する。
多様な言語群に対する文書分類と意図分類において,有効性が著しく向上するのを観察する。
論文 参考訳(メタデータ) (2020-07-29T19:38:35Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Brazilian Lyrics-Based Music Genre Classification Using a BLSTM Network [1.9116784879310027]
本稿では,ブラジルの音楽ジャンルの自動分類に,歌詞のみを用いた新しいアプローチを提案する。
ブラジルの14のジャンルに分布する138,368の歌詞のデータセットを構築した。
ゴスペル」や「ファンク・カリオカ」や「セルタネホ」といったジャンルは最も区別されやすく分類しやすいものとして定義できる。
論文 参考訳(メタデータ) (2020-03-06T05:39:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。