論文の概要: Detecting Synthetic Lyrics with Few-Shot Inference
- arxiv url: http://arxiv.org/abs/2406.15231v1
- Date: Fri, 21 Jun 2024 15:19:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-24 13:13:06.987092
- Title: Detecting Synthetic Lyrics with Few-Shot Inference
- Title(参考訳): Few-Shot推論による合成歌詞の検出
- Authors: Yanis Labrak, Gabriel Meseguer-Brocal, Elena V. Epure,
- Abstract要約: 高品質な合成歌詞の最初のデータセットをキュレートした。
LLM2Vecをベースとした、最も優れた数発の検出器は、スタイリスティックおよび統計的手法を超越しています。
本研究は,創造的コンテンツ検出のさらなる研究の必要性を強調する。
- 参考スコア(独自算出の注目度): 5.448536338411993
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, generated content in music has gained significant popularity, with large language models being effectively utilized to produce human-like lyrics in various styles, themes, and linguistic structures. This technological advancement supports artists in their creative processes but also raises issues of authorship infringement, consumer satisfaction and content spamming. To address these challenges, methods for detecting generated lyrics are necessary. However, existing works have not yet focused on this specific modality or on creative text in general regarding machine-generated content detection methods and datasets. In response, we have curated the first dataset of high-quality synthetic lyrics and conducted a comprehensive quantitative evaluation of various few-shot content detection approaches, testing their generalization capabilities and complementing this with a human evaluation. Our best few-shot detector, based on LLM2Vec, surpasses stylistic and statistical methods, which are shown competitive in other domains at distinguishing human-written from machine-generated content. It also shows good generalization capabilities to new artists and models, and effectively detects post-generation paraphrasing. This study emphasizes the need for further research on creative content detection, particularly in terms of generalization and scalability with larger song catalogs. All datasets, pre-processing scripts, and code are available publicly on GitHub and Hugging Face under the Apache 2.0 license.
- Abstract(参考訳): 近年、音楽の創作されたコンテンツは、様々なスタイル、テーマ、言語構造において人間に似た歌詞を作るために、大きな言語モデルが効果的に活用され、大きな人気を集めている。
この技術進歩は、アーティストが創造的なプロセスで支援するだけでなく、著作権侵害、消費者満足度、コンテンツスパムの問題を提起する。
これらの課題に対処するためには、生成された歌詞を検出する方法が必要である。
しかし、既存の研究は、この特定のモダリティや、機械生成コンテンツ検出方法やデータセットに関する創造的なテキストにまだ焦点を当てていない。
そこで我々は,高品質な合成歌詞の最初のデータセットをキュレートし,多種多様な映像コンテンツ検出手法の包括的定量的評価を行い,その一般化能力を検証し,それを人間による評価で補完した。
LLM2Vecをベースとした我々の最も優れた数発検出器は、機械生成コンテンツと人間の書き起こしを区別する他の領域で競合する、構造的および統計的手法を超越している。
また、新しいアーティストやモデルに優れた一般化能力を示し、ポストジェネレーションのパラフレーズを効果的に検出する。
本研究は、特に、より大きな楽曲カタログによる一般化とスケーラビリティの観点から、創造的コンテンツ検出に関するさらなる研究の必要性を強調する。
すべてのデータセット、前処理スクリプト、コードはGitHubとHugging FaceでApache 2.0ライセンス下で公開されている。
関連論文リスト
- SongCreator: Lyrics-based Universal Song Generation [53.248473603201916]
SongCreatorは、声楽と伴奏の両方で曲を生成するという課題に取り組むために設計された曲生成システムである。
モデルには2つの新しいデザインがある: ボーカルの情報と伴奏を収録するための巧妙に設計された二重系列言語モデル (M) と、DSLMのための一連の注意マスク戦略である。
実験では,8つのタスクすべてに対して,最先端ないし競争的なパフォーマンスを実現することにより,SongCreatorの有効性を示す。
論文 参考訳(メタデータ) (2024-09-09T19:37:07Z) - Multi-task Prompt Words Learning for Social Media Content Generation [8.209163857435273]
マルチモーダル情報融合に基づく新しい単語生成フレームワークを提案する。
一連のプロンプト単語を含むテンプレートを用いて、ChatGPTを誘導し、高品質なツイートを生成する。
コンテンツ生成分野における効果的な客観的評価基準がない場合には、ChatGPTツールを用いてアルゴリズムが生成した結果を評価する。
論文 参考訳(メタデータ) (2024-07-10T15:46:32Z) - Exploring the Efficacy of Pre-trained Checkpoints in Text-to-Music
Generation Task [86.72661027591394]
テキスト記述から完全で意味論的に一貫したシンボリック音楽の楽譜を生成する。
テキスト・音楽生成タスクにおける自然言語処理のための公開チェックポイントの有効性について検討する。
実験結果から, BLEUスコアと編集距離の類似性において, 事前学習によるチェックポイントの使用による改善が統計的に有意であることが示唆された。
論文 参考訳(メタデータ) (2022-11-21T07:19:17Z) - Bridging Music and Text with Crowdsourced Music Comments: A
Sequence-to-Sequence Framework for Thematic Music Comments Generation [18.2750732408488]
我々はクラウドソースの音楽コメントを利用して新しいデータセットを構築し,音楽のテキスト記述を生成するシーケンス・ツー・シーケンス・モデルを提案する。
生成したテキストの信頼性とテーマ性を高めるために,識別器と新しい話題評価器を提案する。
論文 参考訳(メタデータ) (2022-09-05T14:51:51Z) - Youling: an AI-Assisted Lyrics Creation System [72.00418962906083]
本稿では,AIによる歌詞作成システムである textitYouling について紹介する。
歌詞生成プロセスでは、textitYoulingは従来の1パスのフルテキスト生成モードとインタラクティブな生成モードをサポートする。
システムは、ユーザーが望まない文や歌詞の言葉を繰り返し修正できるリビジョンモジュールも提供する。
論文 参考訳(メタデータ) (2022-01-18T03:57:04Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - A General Framework for Learning Prosodic-Enhanced Representation of Rap
Lyrics [21.944835086749375]
ラップ歌詞の学習と分析は、多くのWebアプリケーションにとって重要な基礎です。
階層型注目変動オートエンコーダフレームワーク(HAVAE)を提案する。
様々な特徴を適切に統合し,韻律強調表現を生成する特徴集約戦略を提案する。
論文 参考訳(メタデータ) (2021-03-23T15:13:21Z) - A Comprehensive Survey on Deep Music Generation: Multi-level
Representations, Algorithms, Evaluations, and Future Directions [10.179835761549471]
本稿では,深層学習を用いた音楽生成レベルの違いによる様々な作曲課題の概要について述べる。
さらに,多様なタスクに適したデータセットを要約し,音楽表現,評価方法,および異なるレベルの課題について考察し,最後にいくつかの今後の方向性を指摘する。
論文 参考訳(メタデータ) (2020-11-13T08:01:20Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z) - A Survey of Knowledge-Enhanced Text Generation [81.24633231919137]
テキスト生成の目標は、機械を人間の言語で表現できるようにすることである。
入力テキストを出力テキストにマッピングすることを学ぶことで、目的を達成するために、様々なニューラルエンコーダデコーダモデルが提案されている。
この問題に対処するために、研究者は入力テキスト以外の様々な種類の知識を生成モデルに組み込むことを検討してきた。
論文 参考訳(メタデータ) (2020-10-09T06:46:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。