論文の概要: Say What? Collaborative Pop Lyric Generation Using Multitask Transfer
Learning
- arxiv url: http://arxiv.org/abs/2111.07592v1
- Date: Mon, 15 Nov 2021 08:13:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-16 14:30:08.245234
- Title: Say What? Collaborative Pop Lyric Generation Using Multitask Transfer
Learning
- Title(参考訳): 何だって?
マルチタスク転送学習を用いた協調的pop歌詞生成
- Authors: Naveen Ram, Tanay Gummadi, Rahul Bhethanabotla, Richard J. Savery, Gil
Weinberg
- Abstract要約: 本稿では,T5トランスモデルを用いたトランスファーラーニングを利用したラインレベルのライリック生成システムを提案する。
我々は、韻律、ラインビート要求のマッチング、特定のターゲット語で行を終端するといった、叙情的・スタイリスティックなタスクを学習できるモデルを開発する。
- 参考スコア(独自算出の注目度): 0.9449650062296822
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Lyric generation is a popular sub-field of natural language generation that
has seen growth in recent years. Pop lyrics are of unique interest due to the
genre's unique style and content, in addition to the high level of
collaboration that goes on behind the scenes in the professional pop
songwriting process. In this paper, we present a collaborative line-level lyric
generation system that utilizes transfer-learning via the T5 transformer model,
which, till date, has not been used to generate pop lyrics. By working and
communicating directly with professional songwriters, we develop a model that
is able to learn lyrical and stylistic tasks like rhyming, matching line beat
requirements, and ending lines with specific target words. Our approach
compares favorably to existing methods for multiple datasets and yields
positive results from our online studies and interviews with industry
songwriters.
- Abstract(参考訳): lyric generationは自然言語生成の人気のあるサブ分野であり、近年は成長を遂げている。
ポップ歌詞は、プロのポップ・ソングライティング・プロセスの舞台裏にある高いレベルのコラボレーションに加えて、ジャンルの独特なスタイルとコンテンツのためにユニークな関心を持っている。
本稿では,t5トランスフォーマーモデルによるトランスファーラーニングを活用し,現在までポップ歌詞生成に使われていない線レベルの歌詞生成システムを提案する。
プロのソングライターと直接コミュニケーションすることで、リズムやラインビート要件のマッチング、特定のターゲット単語による行末といった、歌詞やスタイルを学習できるモデルを開発します。
提案手法は,複数データセットの既存手法と比較し,オンライン研究と業界ソングライターへのインタビューから肯定的な結果を得た。
関連論文リスト
- Optimizing the Songwriting Process: Genre-Based Lyric Generation Using Deep Learning Models [2.703659575788133]
本プロジェクトは,ディープラーニング技術を用いて,従来の曲の書き起こしプロセスを簡素化することを目的としている。
我々は、歌詞を個々の詩にパースするためにトークンを用いた独自の前処理フォーマットを開発した。
その結果, ベースラインモデルでは高いリコール(ROUGE)が得られたが, どちらのモデルにも類似の精度(BLEU)が得られた。
論文 参考訳(メタデータ) (2024-09-15T21:32:46Z) - SongCreator: Lyrics-based Universal Song Generation [53.248473603201916]
SongCreatorは、声楽と伴奏の両方で曲を生成するという課題に取り組むために設計された曲生成システムである。
モデルには2つの新しいデザインがある: ボーカルの情報と伴奏を収録するための巧妙に設計された二重系列言語モデル (M) と、DSLMのための一連の注意マスク戦略である。
実験では,8つのタスクすべてに対して,最先端ないし競争的なパフォーマンスを実現することにより,SongCreatorの有効性を示す。
論文 参考訳(メタデータ) (2024-09-09T19:37:07Z) - Encoder-Decoder Framework for Interactive Free Verses with Generation with Controllable High-Quality Rhyming [15.595206559574017]
本稿では,各歌詞の開始時に韻律語を先行する新しい微調整手法を提案する。
我々は、この微調整を現在の韻律の最先端戦略と比較するために、広範囲な実験を行った。
我々は、英語や他の12の言語で高品質なデータセットを提供し、多言語コンテキストにおけるアプローチの実現可能性を分析し、将来的なメソッド比較のためのメトリクスを提案する。
論文 参考訳(メタデータ) (2024-05-08T16:13:40Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z) - Unsupervised Melody-Guided Lyrics Generation [84.22469652275714]
メロディと歌詞の一致したデータを学習することなく、楽しく聴ける歌詞を生成することを提案する。
メロディと歌詞間の重要なアライメントを活用し、与えられたメロディを制約にコンパイルし、生成プロセスを導く。
論文 参考訳(メタデータ) (2023-05-12T20:57:20Z) - Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of
Polyphonic Music [73.73045854068384]
本稿では,新ジャンルネットワークを用いたポリフォニック音楽の歌詞の書き起こしを提案する。
提案するネットワークは,事前学習されたモデルパラメータを採用し,階層間のジャンルアダプタを組み込んで,歌詞とジャンルのペアのジャンルの特色を抽出する。
実験の結果,提案するジャンル条件付きネットワークは既存の歌詞の書き起こしシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-04-07T09:15:46Z) - Youling: an AI-Assisted Lyrics Creation System [72.00418962906083]
本稿では,AIによる歌詞作成システムである textitYouling について紹介する。
歌詞生成プロセスでは、textitYoulingは従来の1パスのフルテキスト生成モードとインタラクティブな生成モードをサポートする。
システムは、ユーザーが望まない文や歌詞の言葉を繰り返し修正できるリビジョンモジュールも提供する。
論文 参考訳(メタデータ) (2022-01-18T03:57:04Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。