論文の概要: Fine-Tuning Large Language Models for Automatic Detection of Sexually Explicit Content in Spanish-Language Song Lyrics
- arxiv url: http://arxiv.org/abs/2602.05485v1
- Date: Thu, 05 Feb 2026 09:45:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.866881
- Title: Fine-Tuning Large Language Models for Automatic Detection of Sexually Explicit Content in Spanish-Language Song Lyrics
- Title(参考訳): スペイン語歌詞における性差的内容の自動検出のための微調整大言語モデル
- Authors: Dolores Zamacola Sánchez de Lamadrid, Eduardo C. Garrido-Merchán,
- Abstract要約: 本稿では,スペイン語の歌詞中の性的な内容を自動的に検出する手法を提案する。
都市ラテン音楽の慣用的言語的特徴に適応するために、生成事前学習トランスフォーマーモデルを微調整する。
本稿では,音楽のための多層年齢型コンテンツレーティングシステムについて,公共政策の提案を行う。
- 参考スコア(独自算出の注目度): 1.3320917259299652
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The proliferation of sexually explicit content in popular music genres such as reggaeton and trap, consumed predominantly by young audiences, has raised significant societal concern regarding the exposure of minors to potentially harmful lyrical material. This paper presents an approach to the automatic detection of sexually explicit content in Spanish-language song lyrics by fine-tuning a Generative Pre-trained Transformer (GPT) model on a curated corpus of 100 songs, evenly divided between expert-labeled explicit and non-explicit categories. The proposed methodology leverages transfer learning to adapt the pre-trained model to the idiosyncratic linguistic features of urban Latin music, including slang, metaphors, and culturally specific double entendres that evade conventional dictionary-based filtering systems. Experimental evaluation on held-out test sets demonstrates that the fine-tuned model achieves 87% accuracy, 100% precision, and 100% specificity after a feedback-driven refinement loop, outperforming both its pre-feedback configuration and a non-customized baseline ChatGPT model. A comparative analysis reveals that the fine-tuned model agrees with expert human classification in 59.2% of cases versus 55.1% for the standard model, confirming that domain-specific adaptation enhances sensitivity to implicit and culturally embedded sexual references. These findings support the viability of deploying fine-tuned large language models as automated content moderation tools on music streaming platforms. Building on these technical results, the paper develops a public policy proposal for a multi-tier age-based content rating system for music analogous to the PEGI system for video games analyzed through the PESTEL framework and Kingdon's Multiple Streams Framework, establishing both the technological feasibility and the policy pathway for systematic music content regulation.
- Abstract(参考訳): 若者が主に消費するレゲットンやトラップなどのポピュラー音楽ジャンルにおける性的に露骨な内容の拡散は、未成年者が潜在的に有害な叙情的な素材に曝されることに関して、社会的な関心を喚起している。
本稿では,100曲のキュレートコーパス上で生成事前学習者モデル(GPT)を微調整することにより,スペイン語の歌詞中の性的な内容を自動的に検出する手法を提案する。
提案手法は移動学習を利用して,従来の辞書に基づくフィルタリングシステムを回避するスラングやメタファー,文化的に特異的な二重エンテンドレスなど,都市ラテン音楽の慣用的言語特徴に事前学習モデルを適用する。
ホールドアウトテストセットに対する実験評価により, フィードバック駆動リファインメントループ後の微調整モデルが87%の精度, 100%の精度, 100%の特異性を達成し, プリフィードバック構成と非カストマイズベースラインChatGPTモデルの両方よりも優れた性能を示した。
比較分析によると、細調整されたモデルは59.2%のケースで専門的な人間の分類と一致しており、標準モデルでは55.1%であり、ドメイン固有の適応は暗黙的および文化的に埋め込まれた性的参照に対する感受性を高める。
これらの知見は,音楽ストリーミングプラットフォーム上でのコンテンツ自動モデレーションツールとして,微調整された大規模言語モデルをデプロイ可能であることを裏付ける。
PESTELフレームワークとKingdonのMultiple Streams Frameworkを用いて分析したゲーム用PEGIシステムに類似する音楽用多層年齢型コンテンツレーティングシステムの提案を行い、音楽コンテンツ規制の技術的実現可能性とポリシーパスを確立する。
関連論文リスト
- Music Flamingo: Scaling Music Understanding in Audio Language Models [98.94537017112704]
Music Flamingoは、基礎的なオーディオモデルにおける音楽理解を促進するために設計された、新しい大きなオーディオ言語モデルである。
MF-Skillsはマルチステージパイプラインを通じてラベル付けされたデータセットで、調和、構造、音色、歌詞、文化的な文脈をカバーする豊富なキャプションと質問応答ペアを生成する。
MF-Thinkは音楽理論に基づく新しいチェーン・オブ・シンク・データセットで、続いてGRPOベースの強化学習とカスタム報酬を取り入れた。
論文 参考訳(メタデータ) (2025-11-13T13:21:09Z) - Evaluation of pretrained language models on music understanding [0.0]
その結果, 言語モデル(LLM)は, 1) アクセシビリティ, 2) 否定をモデル化できないこと, 3) 特定の単語の存在に対する感受性に悩まされていることがわかった。
我々はこれらの特性を三重項に基づく精度として定量化し、階層的オントロジーにおいてラベルの相対的類似性をモデル化する能力を評価した。
比較的高い精度が報告されているにもかかわらず、6つのモデルすべてに矛盾があることは明らかであり、既製のLLMは使用前に音楽に適応する必要があることを示唆している。
論文 参考訳(メタデータ) (2024-09-17T14:44:49Z) - Automatic Detection of Moral Values in Music Lyrics [4.747987317906765]
道徳的価値は、情報を評価し、意思決定し、重要な社会問題に関する判断を形成する上で、基本的な役割を担います。
2人の専門家が注釈付けした200曲のリアル歌詞の道徳的価値を検出するために,2,721の合成歌詞を微調整した変換器ベース言語モデル(BERT)のセットを課題とした。
MFTアノテーション付きソーシャルメディアテキストを微調整したBERTやゼロショット(GPT-4)分類など,一連のベースラインに対する予測能力の評価を行った。
提案したモデルでは、平均F1重み付きスコアが0.8で、実験全体で最高の精度が得られた。
論文 参考訳(メタデータ) (2024-07-26T14:49:21Z) - Synthetic Lyrics Detection Across Languages and Genres [4.987546582439803]
音楽コンテンツ、特に歌詞を生成する大きな言語モデル(LLM)が人気を集めている。
これまで様々な領域におけるコンテンツ検出について研究されてきたが、音楽におけるテキストのモダリティ、歌詞に焦点を当てた研究は行われていない。
我々は、複数の言語、音楽ジャンル、アーティストのリアルとシンセサイザーの多様なデータセットをキュレートした。
既存の合成テキスト検出手法について,未探索のデータ型である歌詞に対して,徹底的に評価を行った。
音楽と産業の制約に従えば、これらのアプローチが言語全体にわたってどのように一般化され、データの可用性に配慮し、多言語言語コンテンツを処理し、数ショット設定で新しいジャンルで演奏するかを検討する。
論文 参考訳(メタデータ) (2024-06-21T15:19:21Z) - MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models [57.47799823804519]
私たちは、ミュージシャンが映画の脚本だけでなく、視覚化を通して音楽を作る方法にインスピレーションを受けています。
本稿では,テキスト記述と対応する画像からの手がかりを効果的に利用して音楽を合成するモデルであるMeLFusionを提案する。
音楽合成パイプラインに視覚情報を加えることで、生成した音楽の質が大幅に向上することを示す。
論文 参考訳(メタデータ) (2024-06-07T06:38:59Z) - Prosody in Cascade and Direct Speech-to-Text Translation: a case study
on Korean Wh-Phrases [79.07111754406841]
本研究は,韻律が重要な役割を果たす発話を明瞭にするための直接S2TTシステムの能力を評価するために,コントラスト評価を用いることを提案する。
本結果は,カスケード翻訳モデルよりも直接翻訳システムの価値を明確に示すものである。
論文 参考訳(メタデータ) (2024-02-01T14:46:35Z) - Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music
Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。
テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。
実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文 参考訳(メタデータ) (2022-11-21T07:19:17Z) - Leveraging Pre-trained Language Model for Speech Sentiment Analysis [58.78839114092951]
本研究では、事前学習された言語モデルを用いて、文章の感情情報を学習し、音声の感情分析を行う。
本稿では,言語モデルを用いた擬似ラベルに基づく半教師付き訓練戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T20:15:21Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。