論文の概要: Language models for longitudinal analysis of abusive content in Billboard Music Charts
- arxiv url: http://arxiv.org/abs/2510.06266v1
- Date: Mon, 06 Oct 2025 01:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.079177
- Title: Language models for longitudinal analysis of abusive content in Billboard Music Charts
- Title(参考訳): ビルボード音楽チャートにおける乱用内容の経時的分析のための言語モデル
- Authors: Rohitash Chandra, Yathin Suresh, Divyansh Raj Sinha, Sanchit Jindal,
- Abstract要約: 我々は過去70年間、アメリカのBillboard Chartsから歌(歌詞)を分析してきた。
その結果、1990年以降のポピュラー音楽における明確な内容の顕著な増加が示されている。
プロファン、性的に明示的で、そうでなければ不適切な言語を含む歌詞を持つ歌の流行が高まる。
- 参考スコア(独自算出の注目度): 3.2654923574107357
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: There is no doubt that there has been a drastic increase in abusive and sexually explicit content in music, particularly in Billboard Music Charts. However, there is a lack of studies that validate the trend for effective policy development, as such content has harmful behavioural changes in children and youths. In this study, we utilise deep learning methods to analyse songs (lyrics) from Billboard Charts of the United States in the last seven decades. We provide a longitudinal study using deep learning and language models and review the evolution of content using sentiment analysis and abuse detection, including sexually explicit content. Our results show a significant rise in explicit content in popular music from 1990 onwards. Furthermore, we find an increasing prevalence of songs with lyrics containing profane, sexually explicit, and otherwise inappropriate language. The longitudinal analysis of the ability of language models to capture nuanced patterns in lyrical content, reflecting shifts in societal norms and language use over time.
- Abstract(参考訳): 特にビルボード・ミュージック・チャート(Billboard Music Charts)では、虐待的かつ性的に露骨な音楽コンテンツが大幅に増加したことは疑いない。
しかし、子どもや若者に有害な行動変化があるため、効果的な政策展開の傾向を検証する研究は乏しい。
本研究では,過去70年間に米国ビルボードチャートから楽曲(歌詞)を分析するためのディープラーニング手法を利用した。
ディープラーニングと言語モデルを用いた縦断的研究を行い、感情分析と乱用検出を用いて、性的に明示的な内容を含むコンテンツの進化をレビューする。
以上の結果から,1990年以降のポピュラー音楽における明示的な内容の顕著な増加が示唆された。
さらに, 韻文, 性的明示性, その他の不適切な言語を含む歌詞が出現する傾向がみられた。
言語モデルが歌詞内容のニュアンスパターンを捉える能力の経時的分析は、社会規範や言語使用の経時変化を反映している。
関連論文リスト
- Fine-Tuning Large Language Models for Automatic Detection of Sexually Explicit Content in Spanish-Language Song Lyrics [1.3320917259299652]
本稿では,スペイン語の歌詞中の性的な内容を自動的に検出する手法を提案する。
都市ラテン音楽の慣用的言語的特徴に適応するために、生成事前学習トランスフォーマーモデルを微調整する。
本稿では,音楽のための多層年齢型コンテンツレーティングシステムについて,公共政策の提案を行う。
論文 参考訳(メタデータ) (2026-02-05T09:45:09Z) - AVMeme Exam: A Multimodal Multilingual Multicultural Benchmark for LLMs' Contextual and Cultural Knowledge and Thinking [59.15472057710525]
AVMeme Examは、音声、歌、音楽、サウンドエフェクトにまたがる、1000以上の象徴的なインターネットの音とビデオの人間による評価ベンチマークである。
各ミームは、表面コンテンツからコンテキスト、感情、使用法、世界知識への理解レベルを評価するユニークなQ&Aと組み合わせられる。
このベンチマークを用いて,最先端のマルチモーダル言語モデル (MLLM) を人間の参加者とともに体系的に評価した。
論文 参考訳(メタデータ) (2026-01-25T01:40:15Z) - Abusive music and song transformation using GenAI and LLMs [3.8271803328378677]
本研究では,ジェネレーティブ・人工知能(GenAI)とLarge Language Models(LLMs)を用いて,ポピュラー音楽における虐待的言葉(音声配信)や歌詞の内容を自動的に変換する方法について検討する。
選択した4つの英曲とその変換された曲の比較分析を行い、音響および感情に基づくレンズによる変化を評価した。
以上の結果から,Gen-AIは高調波と雑音比,ケプストラルピークプロミネンス,シマーの改善を呈し,声の攻撃性を著しく低下させることが明らかとなった。
論文 参考訳(メタデータ) (2026-01-21T02:56:45Z) - CURVE: A Benchmark for Cultural and Multilingual Long Video Reasoning [58.73855961335903]
CURVE(Cultural Understanding and Reasoning in Video Evaluation)は、多言語・多言語ビデオ推論のための挑戦的なベンチマークである。
18のグローバルローカライズされた、地域固有の文化的ビデオから、高品質で完全な人為的なアノテーションを含んでいる。
以上の結果から, SoTA Video-LLM は人間レベルの精度よりもかなり低い精度で動作していることが明らかとなった。
論文 参考訳(メタデータ) (2026-01-15T18:15:06Z) - SongSage: A Large Musical Language Model with Lyric Generative Pre-training [69.52790104805794]
SongSageは、多種多様な歌詞中心のインテリジェンスを備えた大規模な音楽モデルである。
SongSageは歌詞中心の知識を強く理解し、ゼロショットプレイリストのレコメンデーションのためにユーザークエリを書き直し、歌詞を効果的に生成し、継続し、7つの追加機能で巧みに実行する。
論文 参考訳(メタデータ) (2026-01-03T10:54:37Z) - Music Flamingo: Scaling Music Understanding in Audio Language Models [98.94537017112704]
Music Flamingoは、基礎的なオーディオモデルにおける音楽理解を促進するために設計された、新しい大きなオーディオ言語モデルである。
MF-Skillsはマルチステージパイプラインを通じてラベル付けされたデータセットで、調和、構造、音色、歌詞、文化的な文脈をカバーする豊富なキャプションと質問応答ペアを生成する。
MF-Thinkは音楽理論に基づく新しいチェーン・オブ・シンク・データセットで、続いてGRPOベースの強化学習とカスタム報酬を取り入れた。
論文 参考訳(メタデータ) (2025-11-13T13:21:09Z) - Disc-Cover Complexity Trends in Music Illustrations from Sinatra to Swift [51.70874799858211]
アルバムカバーの視覚的複雑さについて検討し,75年間,11種類のポピュラー音楽ジャンルについて検討した。
我々の分析は、例外を除いて、ほとんどのジャンルでミニマリズムへの幅広いシフトを明らかにしている。
同時に、時間とともに変化するばらつきを観察し、多くのカバーは高いレベルの抽象化と複雑さを示し続けています。
論文 参考訳(メタデータ) (2025-10-01T15:01:25Z) - Longitudinal Abuse and Sentiment Analysis of Hollywood Movie Dialogues using Language Models [3.503370263836711]
1950年から2024年までのハリウッド・オスカーとブロックバスター映画対話の縦断的虐待と感情分析について,言語モデルを用いて検討した。
我々は過去70年間の感情的および虐待的コンテンツの傾向と変化を調べるために、微調整の言語モデルを採用している。
発見は、より広い社会的・文化的影響を反映した映画対話の時間的変化を示す。
論文 参考訳(メタデータ) (2025-01-20T00:44:38Z) - Synthetic Lyrics Detection Across Languages and Genres [4.987546582439803]
音楽コンテンツ、特に歌詞を生成する大きな言語モデル(LLM)が人気を集めている。
これまで様々な領域におけるコンテンツ検出について研究されてきたが、音楽におけるテキストのモダリティ、歌詞に焦点を当てた研究は行われていない。
我々は、複数の言語、音楽ジャンル、アーティストのリアルとシンセサイザーの多様なデータセットをキュレートした。
既存の合成テキスト検出手法について,未探索のデータ型である歌詞に対して,徹底的に評価を行った。
音楽と産業の制約に従えば、これらのアプローチが言語全体にわたってどのように一般化され、データの可用性に配慮し、多言語言語コンテンツを処理し、数ショット設定で新しいジャンルで演奏するかを検討する。
論文 参考訳(メタデータ) (2024-06-21T15:19:21Z) - Unsupervised Melody-Guided Lyrics Generation [84.22469652275714]
メロディと歌詞の一致したデータを学習することなく、楽しく聴ける歌詞を生成することを提案する。
メロディと歌詞間の重要なアライメントを活用し、与えられたメロディを制約にコンパイルし、生成プロセスを導く。
論文 参考訳(メタデータ) (2023-05-12T20:57:20Z) - ReDDIT: Regret Detection and Domain Identification from Text [62.997667081978825]
本稿では,Redditテキストのデータセットを,Regret by Action,Regret by Inaction,No Regretの3つのクラスに分類した。
以上の結果から,Reddit利用者は過去の行動,特に関係領域における後悔を表明しがちであることがわかった。
論文 参考訳(メタデータ) (2022-12-14T23:41:57Z) - Large scale analysis of gender bias and sexism in song lyrics [3.437656066916039]
我々は,手動で注釈付けされたポピュラーソングの小さなサンプルを用いて,以前の研究よりも大規模な性差別的な歌詞を同定した。
性差別的なコンテンツは、特に男性アーティストやBillboardチャートに掲載されている人気曲から、時間とともに増えていくだろう。
これは、このタイプの最初の大規模分析であり、大衆文化のそのような影響力のある部分における言語使用に関する洞察を与えている。
論文 参考訳(メタデータ) (2022-08-03T13:18:42Z) - VidLanKD: Improving Language Understanding via Video-Distilled Knowledge
Transfer [76.3906723777229]
言語理解を改善するためのビデオ言語知識蒸留法VidLanKDを提案する。
我々は、ビデオテキストデータセット上でマルチモーダル教師モデルを訓練し、その知識をテキストデータセットを用いて学生言語モデルに伝達する。
我々の実験では、VidLanKDはテキストのみの言語モデルや発声モデルよりも一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-07-06T15:41:32Z) - What's in the Box? An Analysis of Undesirable Content in the Common
Crawl Corpus [77.34726150561087]
言語モデルの訓練に広く使用されるコロッサルwebコーパスであるcommon crawlを分析した。
ヘイトスピーチや性的明示的なコンテンツなど、フィルタリング処理後も、好ましくないコンテンツがかなりの量含まれていることがわかりました。
論文 参考訳(メタデータ) (2021-05-06T14:49:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。