論文の概要: Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics
- arxiv url: http://arxiv.org/abs/2303.09364v1
- Date: Thu, 16 Mar 2023 14:47:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:13:42.994709
- Title: Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics
- Title(参考訳): Tollywood Emotions: Annotation of Valence-Arousal in Telugu Song Lyrics
- Authors: R Guru Ravi Shanker, B Manikanta Gupta, BV Koushik, Vinoo Alluri
- Abstract要約: Spotifyから収集したTeluguの歌詞を手動で注釈付けしたデータセットを提示する。
2つの分類手法を用いて2つの音楽感情認識モデルを作成する。
データセットを、歌詞、アノテーション、Spotify IDで公開しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emotion recognition from a given music track has heavily relied on acoustic
features, social tags, and metadata but is seldom focused on lyrics. There are
no datasets of Indian language songs that contain both valence and arousal
manual ratings of lyrics. We present a new manually annotated dataset of Telugu
songs' lyrics collected from Spotify with valence and arousal annotated on a
discrete scale. A fairly high inter-annotator agreement was observed for both
valence and arousal. Subsequently, we create two music emotion recognition
models by using two classification techniques to identify valence, arousal and
respective emotion quadrant from lyrics. Support vector machine (SVM) with term
frequency-inverse document frequency (TF-IDF) features and fine-tuning the
pre-trained XLMRoBERTa (XLM-R) model were used for valence, arousal and
quadrant classification tasks. Fine-tuned XLMRoBERTa performs better than the
SVM by improving macro-averaged F1-scores of 54.69%, 67.61%, 34.13% to 77.90%,
80.71% and 58.33% for valence, arousal and quadrant classifications,
respectively, on 10-fold cross-validation. In addition, we compare our lyrics
annotations with Spotify's annotations of valence and energy (same as arousal),
which are based on entire music tracks. The implications of our findings are
discussed. Finally, we make the dataset publicly available with lyrics,
annotations and Spotify IDs.
- Abstract(参考訳): 特定の音楽トラックからの感情認識は、音響的特徴、ソーシャルタグ、メタデータに大きく依存しているが、歌詞にはほとんど焦点を当てていない。
ヴァレンスと覚醒的手動による歌詞評価の両方を含むインドの歌のデータセットは存在しない。
本稿では,Spotifyから収集したTeluguの歌詞を手作業で注釈付けした新しいデータセットについて紹介する。
ヴァレンスと覚醒の両方において、かなり高いアノテータ間合意が観察された。
次に,2つの分類手法を用いて,歌詞からヴァレンス,覚醒,それぞれの感情を識別する音楽感情認識モデルを作成する。
時間周波数逆文書周波数(TF-IDF)特性と事前学習したXLMRoBERTa(XLM-R)モデルを微調整したサポートベクターマシン(SVM)を用いた。
微調整されたXLMRoBERTaは、平均F1スコア(54.69%、67.61%、34.13%から77.90%、80.71%、58.33%)を10倍のクロスバリデーションで改善し、SVMよりも優れている。
さらに、歌詞の注釈をspotifyのヴァレンスとエネルギの注釈(arousalと同じ)と比較した。
本研究の意義について述べる。
最後に、私たちはデータセットを歌詞、アノテーション、spotify idで公開しています。
関連論文リスト
- An Analysis of Classification Approaches for Hit Song Prediction using
Engineered Metadata Features with Lyrics and Audio Features [5.871032585001082]
本研究は,より代替的なメタデータを用いて,Billboard Hot 100曲のトップ10ヒット曲の予測結果を改善することを目的としている。
k-nearest、Naive Bayes、Random Forest、Logistic Regression、Multilayer Perceptronの5つの機械学習アプローチが適用される。
その結果,Random Forest (RF) と Logistic Regression (LR) は,それぞれ89.1%,87.2%,0.91,0.93AUCを達成している。
論文 参考訳(メタデータ) (2023-01-31T09:48:53Z) - Modelling Emotion Dynamics in Song Lyrics with State Space Models [4.18804572788063]
本研究では,歌詞の感情動態を楽曲レベルの監督なしに予測する手法を提案する。
提案手法を適用すれば,注釈付き楽曲を必要とせずに文レベルベースラインの性能を常に向上できることを示す。
論文 参考訳(メタデータ) (2022-10-17T21:07:23Z) - The Contribution of Lyrics and Acoustics to Collaborative Understanding
of Mood [7.426508199697412]
データ駆動分析により歌詞と気分の関連性を検討した。
われわれのデータセットは100万曲近くで、Spotifyのストリーミングプラットフォーム上のユーザープレイリストから曲とムードのアソシエーションが生まれている。
我々は、トランスフォーマーに基づく最先端の自然言語処理モデルを利用して、歌詞と気分の関係を学習する。
論文 参考訳(メタデータ) (2022-05-31T19:58:41Z) - A Novel Multi-Task Learning Method for Symbolic Music Emotion
Recognition [76.65908232134203]
Symbolic Music Emotion Recognition(SMER)は、MIDIやMusicXMLなどのシンボリックデータから音楽の感情を予測すること。
本稿では、感情認識タスクを他の感情関連補助タスクに組み込む、SMERのためのシンプルなマルチタスクフレームワークを提案する。
論文 参考訳(メタデータ) (2022-01-15T07:45:10Z) - Musical Prosody-Driven Emotion Classification: Interpreting Vocalists
Portrayal of Emotions Through Machine Learning [0.0]
音楽の韻律の役割は、いくつかの研究が韻律と感情の強い結びつきを示しているにもかかわらず、まだ解明されていない。
本研究では,従来の機械学習アルゴリズムの入力を音楽韻律の特徴に限定する。
我々は,ボーカリストの個人データ収集手法と,アーティスト自身による個人的根拠的真理ラベル付け手法を利用する。
論文 参考訳(メタデータ) (2021-06-04T15:40:19Z) - Phoneme Recognition through Fine Tuning of Phonetic Representations: a
Case Study on Luhya Language Varieties [77.2347265289855]
音韻アノテーションに基づく多言語認識手法であるAllosaurus を用いた音素認識に焦点を当てた。
挑戦的な実世界シナリオで評価するために,我々は,ケニア西部とウガンダ東部のluhya言語クラスタの2つの種類であるbukusuとsaamiaの音声認識データセットをキュレートした。
私たちは、アロサウルスの微調整がわずか100発話であっても、電話のエラー率を大幅に改善することが分かりました。
論文 参考訳(メタデータ) (2021-04-04T15:07:55Z) - Neural Network architectures to classify emotions in Indian Classical
Music [0.0]
JUMusEmoDBと呼ばれる新しいデータセットは、現在400のオーディオクリップ(それぞれ30秒)を持っている。
教師付き分類のために、我々は既存の4つの深層畳み込みニューラルネットワーク(CNN)ベースのアーキテクチャを使用した。
インド古典音楽の豊富なコーパスを用いたCNNに基づく分類アルゴリズムは,グローバルな視点においても独特である。
論文 参考訳(メタデータ) (2021-02-01T03:41:25Z) - SongMASS: Automatic Song Writing with Pre-training and Alignment
Constraint [54.012194728496155]
SongMASSは、歌詞からメロディーへの生成とメロディから歌詞への生成の課題を克服するために提案されている。
マスクドシーケンスを利用して、シーケンス(質量)事前トレーニングと注意に基づくアライメントモデリングを行う。
我々は,SongMASSがベースライン法よりもはるかに高品質な歌詞とメロディを生成することを示す。
論文 参考訳(メタデータ) (2020-12-09T16:56:59Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z) - Emotion-Based End-to-End Matching Between Image and Music in
Valence-Arousal Space [80.49156615923106]
イメージと音楽に類似した感情を合わせることは、感情の知覚をより鮮明で強くするのに役立つ。
既存の感情に基づく画像と音楽のマッチング手法では、限られたカテゴリーの感情状態を使用するか、非現実的なマルチステージパイプラインを使用してマッチングモデルを訓練する。
本稿では,連続的原子価覚醒空間(VA)における感情に基づく画像と音楽のエンドツーエンドマッチングについて検討する。
論文 参考訳(メタデータ) (2020-08-22T20:12:23Z) - Multi-Modal Music Information Retrieval: Augmenting Audio-Analysis with
Visual Computing for Improved Music Video Analysis [91.3755431537592]
この論文は、音声分析とコンピュータビジョンを組み合わせて、マルチモーダルの観点から音楽情報検索(MIR)タスクにアプローチする。
本研究の主な仮説は、ジャンルやテーマなど特定の表現的カテゴリーを視覚的内容のみに基づいて認識できるという観察に基づいている。
実験は、3つのMIRタスクに対して行われ、アーティスト識別、音楽ジェネア分類、クロスジェネア分類を行う。
論文 参考訳(メタデータ) (2020-02-01T17:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。