論文の概要: In BLOOM: Creativity and Affinity in Artificial Lyrics and Art
- arxiv url: http://arxiv.org/abs/2301.05402v1
- Date: Fri, 13 Jan 2023 06:22:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 14:07:43.658270
- Title: In BLOOM: Creativity and Affinity in Artificial Lyrics and Art
- Title(参考訳): BLOOM:人工歌詞とアートの創造性と親和性
- Authors: Evan Crothers, Herna Viktor, Nathalie Japkowicz
- Abstract要約: 我々は、中国語の歌詞のオープンな世代に大規模な多言語言語モデル(BLOOM-176B)を適用した。
人間のレビュアーを用いたコヒーレンス・クリエイティビティのための歌詞の評価を行った。
今後の研究のために,人気のある歌詞の中国語データセットであるMojimLyricsデータセットを紹介した。
- 参考スコア(独自算出の注目度): 6.978441815839558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We apply a large multilingual language model (BLOOM-176B) in open-ended
generation of Chinese song lyrics, and evaluate the resulting lyrics for
coherence and creativity using human reviewers. We find that current
computational metrics for evaluating large language model outputs (MAUVE) have
limitations in evaluation of creative writing. We note that the human concept
of creativity requires lyrics to be both comprehensible and distinctive -- and
that humans assess certain types of machine-generated lyrics to score more
highly than real lyrics by popular artists. Inspired by the inherently
multimodal nature of album releases, we leverage a Chinese-language stable
diffusion model to produce high-quality lyric-guided album art, demonstrating a
creative approach for an artist seeking inspiration for an album or single.
Finally, we introduce the MojimLyrics dataset, a Chinese-language dataset of
popular song lyrics for future research.
- Abstract(参考訳): 我々は,中国語の歌詞のオープンな生成に大規模な多言語言語モデル(BLOOM-176B)を適用し,人間のレビュアーによる一貫性と創造性を評価する。
大規模言語モデル出力(MAUVE)を評価するための現在の計算量には,創造的記述の評価に制限があることがわかった。
クリエイティビティの人間的概念では、歌詞は理解可能かつ独特であり、人間は特定の種類の機械によって生成された歌詞を評価し、人気アーティストの実際の歌詞よりも高いスコアを付ける必要がある。
アルバムリリースの本質的にマルチモーダルな性質にインスパイアされた我々は、中国語の安定拡散モデルを利用して高品質な歌詞誘導アルバムアートを作成し、アルバムやシングルのインスピレーションを求めるアーティストにとって創造的なアプローチを示す。
最後に,今後の研究のために,人気歌詞の中国語データセットであるMojimLyricsデータセットを紹介する。
関連論文リスト
- Agent-Driven Large Language Models for Mandarin Lyric Generation [2.2221991003992967]
マンダリンのような音節の輪郭言語では、ピッチの輪郭はメロディとトーンの両方に影響され、歌詞とメロディの適合性が変化する。
本研究は,作詞家やメロディ作家が作曲過程に適合していることを確認する。
本研究では,メロディから歌詞へのタスクをサブタスクに分解するマルチエージェントシステムを開発し,各エージェントが韻律,音節数,歌詞・メロディのアライメント,一貫性を制御している。
論文 参考訳(メタデータ) (2024-10-02T12:01:32Z) - SongCreator: Lyrics-based Universal Song Generation [53.248473603201916]
SongCreatorは、声楽と伴奏の両方で曲を生成するという課題に取り組むために設計された曲生成システムである。
モデルには2つの新しいデザインがある: ボーカルの情報と伴奏を収録するための巧妙に設計された二重系列言語モデル (M) と、DSLMのための一連の注意マスク戦略である。
実験では,8つのタスクすべてに対して,最先端ないし競争的なパフォーマンスを実現することにより,SongCreatorの有効性を示す。
論文 参考訳(メタデータ) (2024-09-09T19:37:07Z) - Detecting Synthetic Lyrics with Few-Shot Inference [5.448536338411993]
高品質な合成歌詞の最初のデータセットをキュレートした。
LLM2Vecをベースとした、最も優れた数発の検出器は、スタイリスティックおよび統計的手法を超越しています。
本研究は,創造的コンテンツ検出のさらなる研究の必要性を強調する。
論文 参考訳(メタデータ) (2024-06-21T15:19:21Z) - MeLFusion: Synthesizing Music from Image and Language Cues using Diffusion Models [57.47799823804519]
私たちは、ミュージシャンが映画の脚本だけでなく、視覚化を通して音楽を作る方法にインスピレーションを受けています。
本稿では,テキスト記述と対応する画像からの手がかりを効果的に利用して音楽を合成するモデルであるMeLFusionを提案する。
音楽合成パイプラインに視覚情報を加えることで、生成した音楽の質が大幅に向上することを示す。
論文 参考訳(メタデータ) (2024-06-07T06:38:59Z) - LyricWhiz: Robust Multilingual Zero-shot Lyrics Transcription by Whispering to ChatGPT [48.28624219567131]
リリックウィズ(LyricWhiz)は、頑健で、多言語で、ゼロショットの自動歌詞書き起こし方式である。
我々は、弱教師付き頑健な音声認識モデルであるWhisperと、今日の最もパフォーマンスの高いチャットベースの大規模言語モデルであるGPT-4を使用している。
実験の結果,LyricWhizは英語の既存手法に比べて単語誤り率を大幅に低下させることがわかった。
論文 参考訳(メタデータ) (2023-06-29T17:01:51Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z) - Unsupervised Melody-Guided Lyrics Generation [84.22469652275714]
メロディと歌詞の一致したデータを学習することなく、楽しく聴ける歌詞を生成することを提案する。
メロディと歌詞間の重要なアライメントを活用し、与えられたメロディを制約にコンパイルし、生成プロセスを導く。
論文 参考訳(メタデータ) (2023-05-12T20:57:20Z) - Youling: an AI-Assisted Lyrics Creation System [72.00418962906083]
本稿では,AIによる歌詞作成システムである textitYouling について紹介する。
歌詞生成プロセスでは、textitYoulingは従来の1パスのフルテキスト生成モードとインタラクティブな生成モードをサポートする。
システムは、ユーザーが望まない文や歌詞の言葉を繰り返し修正できるリビジョンモジュールも提供する。
論文 参考訳(メタデータ) (2022-01-18T03:57:04Z) - Say What? Collaborative Pop Lyric Generation Using Multitask Transfer
Learning [0.9449650062296822]
本稿では,T5トランスモデルを用いたトランスファーラーニングを利用したラインレベルのライリック生成システムを提案する。
我々は、韻律、ラインビート要求のマッチング、特定のターゲット語で行を終端するといった、叙情的・スタイリスティックなタスクを学習できるモデルを開発する。
論文 参考訳(メタデータ) (2021-11-15T08:13:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。