論文の概要: Melody Construction for Persian lyrics using LSTM recurrent neural networks
- arxiv url: http://arxiv.org/abs/2410.18203v1
- Date: Wed, 23 Oct 2024 18:11:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:48:31.701996
- Title: Melody Construction for Persian lyrics using LSTM recurrent neural networks
- Title(参考訳): LSTMリカレントニューラルネットワークを用いたペルシア語歌詞のメロディ構築
- Authors: Farshad Jafari, Farzad Didehvar, Amin Gheibi,
- Abstract要約: 歌詞の音節とメロディの間には音韻的相関があることが推定された。
この仮定を調査するためにSeq2seqニューラルネットワークを開発した。
ペルシャの歌のパラレル音節と音節列で訓練され、新しい音節列のための快楽な旋律が提案された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The present paper investigated automatic melody construction for Persian lyrics as an input. It was assumed that there is a phonological correlation between the lyric syllables and the melody in a song. A seq2seq neural network was developed to investigate this assumption, trained on parallel syllable and note sequences in Persian songs to suggest a pleasant melody for a new sequence of syllables. More than 100 pieces of Persian music were collected and converted from the printed version to the digital format due to the lack of a dataset on Persian digital music. Finally, 14 new lyrics were given to the model as input, and the suggested melodies were performed and recorded by music experts to evaluate the trained model. The evaluation was conducted using an audio questionnaire, which more than 170 persons answered. According to the answers about the pleasantness of melody, the system outputs scored an average of 3.005 from 5, while the human-made melodies for the same lyrics obtained an average score of 4.078.
- Abstract(参考訳): 本稿ではペルシャ語歌詞の自動メロディ構成を入力として検討した。
歌詞の音節とメロディの間には音韻的相関があることが推定された。
セク2セクニューラルネットワークは、ペルシャ語の歌のパラレル音節と音節列に基づいて訓練され、新しい音節列のための快適なメロディを提案するために、この仮定を調査するために開発された。
ペルシア音楽のデータセットが不足していたため、100曲以上のペルシア音楽が印刷版からデジタル形式に変換された。
最後に、入力として14の新たな歌詞が与えられ、提案された旋律が演奏され、音楽専門家によって録音され、訓練されたモデルが評価された。
評価は170人以上の回答を得た音声アンケートを用いて行った。
メロディの楽しさに関する回答は,5から平均3.005点,同歌詞の人造メロディは平均4.078点であった。
関連論文リスト
- Syllable-level lyrics generation from melody exploiting character-level
language model [14.851295355381712]
シンボリック・メロディから音節レベルの歌詞を生成するための微調整文字レベル言語モデルを提案する。
特に,言語モデルの言語知識を音節レベルのトランスフォーマー生成ネットワークのビームサーチプロセスに組み込む手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T02:53:29Z) - Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。
我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。
我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文 参考訳(メタデータ) (2023-05-30T17:20:25Z) - Unsupervised Melody-Guided Lyrics Generation [84.22469652275714]
メロディと歌詞の一致したデータを学習することなく、楽しく聴ける歌詞を生成することを提案する。
メロディと歌詞間の重要なアライメントを活用し、与えられたメロディを制約にコンパイルし、生成プロセスを導く。
論文 参考訳(メタデータ) (2023-05-12T20:57:20Z) - Deep Attention-Based Alignment Network for Melody Generation from
Incomplete Lyrics [12.05359079565586]
ディープ・ニューラル・歌詞・メロディネットをエンコーダ・デコーダ方式で訓練し、不完全な歌詞が与えられたときの歌詞・メロディのペアを予測する。
注意機構を利用して、歌詞からメロディ生成中に予測された歌詞とメロディを一致させる。
論文 参考訳(メタデータ) (2023-01-23T03:41:53Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - Re-creation of Creations: A New Paradigm for Lyric-to-Melody Generation [158.54649047794794]
Re-creation of Creations (ROC)は、歌詞からメロディ生成のための新しいパラダイムである。
ROCは、Lyric-to-Meody生成において、優れたLyric-Meody特徴アライメントを実現する。
論文 参考訳(メタデータ) (2022-08-11T08:44:47Z) - Genre-conditioned Acoustic Models for Automatic Lyrics Transcription of
Polyphonic Music [73.73045854068384]
本稿では,新ジャンルネットワークを用いたポリフォニック音楽の歌詞の書き起こしを提案する。
提案するネットワークは,事前学習されたモデルパラメータを採用し,階層間のジャンルアダプタを組み込んで,歌詞とジャンルのペアのジャンルの特色を抽出する。
実験の結果,提案するジャンル条件付きネットワークは既存の歌詞の書き起こしシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-04-07T09:15:46Z) - Automatic Neural Lyrics and Melody Composition [6.574381538711984]
提案するシステムであるAutomatic Neural Lyrics and Melody Composition (AutoNLMC)は,人工ニューラルネットワークを用いて曲の書き起こし全体を自動化しようとする試みである。
音節, 単語, 文レベルで解析した大集合の歌詞-メロディペアに基づいて学習した歌詞からベクトル(歌詞2vec)モデルは, 大規模埋め込みモデルである。
また、プロの歌詞作家の歌詞を使って、一致する旋律を生成することもできる。
論文 参考訳(メタデータ) (2020-11-12T13:44:01Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。