Fugu-MT 論文翻訳(概要): WuYun: Exploring hierarchical skeleton-guided melody generation using knowledge-enhanced deep learning

論文の概要: WuYun: Exploring hierarchical skeleton-guided melody generation using knowledge-enhanced deep learning

arxiv url: http://arxiv.org/abs/2301.04488v1
Date: Wed, 11 Jan 2023 14:33:42 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-12 18:03:42.056069
Title: WuYun: Exploring hierarchical skeleton-guided melody generation using knowledge-enhanced deep learning
Title（参考訳）: WuYun:知識強化深層学習を用いた階層型骨格誘導メロディ生成の探索
Authors: Kejun Zhang, Xinda Wu, Tieyao Zhang, Zhijie Huang, Xu Tan, Qihao Liang, Songruoyao Wu, and Lingyun Sun
Abstract要約: WuYunは、生成された旋律の構造を改善するための知識に富んだディープラーニングアーキテクチャである。音楽領域の知識を用いてメロディカルスケルトンを抽出し、シーケンシャルラーニングを用いて再構成する。 We demonstrate that WuYun can generate melodies with better long-term structure and musicality and improves other-of-the-art method by average 0.51。
参考スコア（独自算出の注目度）: 26.515527387450636
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Although deep learning has revolutionized music generation, existing methods for structured melody generation follow an end-to-end left-to-right note-by-note generative paradigm and treat each note equally. Here, we present WuYun, a knowledge-enhanced deep learning architecture for improving the structure of generated melodies, which first generates the most structurally important notes to construct a melodic skeleton and subsequently infills it with dynamically decorative notes into a full-fledged melody. Specifically, we use music domain knowledge to extract melodic skeletons and employ sequence learning to reconstruct them, which serve as additional knowledge to provide auxiliary guidance for the melody generation process. We demonstrate that WuYun can generate melodies with better long-term structure and musicality and outperforms other state-of-the-art methods by 0.51 on average on all subjective evaluation metrics. Our study provides a multidisciplinary lens to design melodic hierarchical structures and bridge the gap between data-driven and knowledge-based approaches for numerous music generation tasks.
Abstract（参考訳）: ディープ・ラーニングは音楽生成に革命をもたらしたが、既存の構造化メロディ生成手法は、左右のノート・バイ・ノート生成パラダイムに従い、各ノートを等しく扱う。本稿では,メロディ構造を改善するための知識に富んだ深層学習アーキテクチャであるWuYunについて紹介する。具体的には,音楽領域の知識を用いて旋律生成過程の補助的指導を行うための追加知識として,旋律骨格を抽出し,シーケンス学習を用いて再構築する。以上の結果から, ウーユンは, 長期的構造と音楽性に優れる旋律を生成でき, 主観的評価指標の平均で0.51 % の精度で他の最先端手法を上回った。本研究は,メロディックな階層構造を設計し,データ駆動型と知識に基づく多くの音楽生成タスクのギャップを埋めるための多分野レンズを提供する。

関連論文リスト

Music Flamingo: Scaling Music Understanding in Audio Language Models [98.94537017112704]
Music Flamingoは、基礎的なオーディオモデルにおける音楽理解を促進するために設計された、新しい大きなオーディオ言語モデルである。 MF-Skillsはマルチステージパイプラインを通じてラベル付けされたデータセットで、調和、構造、音色、歌詞、文化的な文脈をカバーする豊富なキャプションと質問応答ペアを生成する。 MF-Thinkは音楽理論に基づく新しいチェーン・オブ・シンク・データセットで、続いてGRPOベースの強化学習とカスタム報酬を取り入れた。
論文参考訳（メタデータ） (2025-11-13T13:21:09Z)
Discovering "Words" in Music: Unsupervised Learning of Compositional Sparse Code for Symbolic Music [50.87225308217594]
本稿では,記号的音楽データから「音楽単語」と呼ばれる繰り返しパターンを識別する教師なし機械学習アルゴリズムを提案する。本稿では,音楽単語発見の課題を統計的最適化問題として定式化し,二段階予測最大化(EM)に基づく学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-29T11:10:57Z)
YuE: Scaling Open Foundation Models for Long-Form Music Generation [134.54174498094565]
YuEはLLaMA2アーキテクチャに基づいたオープンファンデーションモデルのファミリーである。歌詞のアライメント、コヒーレントな音楽構造、適切な伴奏を伴う声楽メロディを維持しながら、最大5分間の音楽を生成する。
論文参考訳（メタデータ） (2025-03-11T17:26:50Z)
SongComposer: A Large Language Model for Lyric and Melody Generation in Song Composition [82.38021790213752]
SongComposerは、音楽専門の大規模言語モデル(LLM)である。 3つの重要なイノベーションを活用することで、メロディーをLLMに同時に構成する能力を統合する。歌詞からメロディへの生成、メロディから歌詞への生成、歌の継続、テキストから歌への生成といったタスクにおいて、高度なLLMよりも優れています。 SongComposeは大規模なトレーニング用データセットで、中国語と英語の歌詞とメロディのペアを含む。
論文参考訳（メタデータ） (2024-02-27T16:15:28Z)
Structure-informed Positional Encoding for Music Generation [0.0]
トランスフォーマーを用いた音楽生成のための構造インフォームド位置符号化フレームワークを提案する。我々は、次のステップ予測と伴奏生成という2つのシンボリックな音楽生成タスクでそれらをテストした。提案手法は, 生成した部品の旋律的および構造的整合性を改善する。
論文参考訳（メタデータ） (2024-02-20T13:41:35Z)
MelodyGLM: Multi-task Pre-training for Symbolic Melody Generation [39.892059799407434]
MelodyGLMは長期構造を持つメロディを生成するためのマルチタスク事前学習フレームワークである。我々は,0.4百万以上のメロディを含む大規模な記号的メロディデータセットMelodyNetを構築した。
論文参考訳（メタデータ） (2023-09-19T16:34:24Z)
Unsupervised Melody-to-Lyric Generation [91.29447272400826]
本稿では,メロディ・歌詞データを学習することなく高品質な歌詞を生成する手法を提案する。我々は、メロディと歌詞のセグメンテーションとリズムアライメントを利用して、与えられたメロディをデコード制約にコンパイルする。我々のモデルは、強いベースラインよりもオントピー的、歌いやすく、知性があり、一貫性のある高品質な歌詞を生成することができる。
論文参考訳（メタデータ） (2023-05-30T17:20:25Z)
MeloForm: Generating Melody with Musical Form based on Expert Systems and Neural Networks [146.59245563763065]
MeloFormは、エキスパートシステムとニューラルネットワークを使用して、音楽形式でメロディを生成するシステムである。詩やコーラス形式、ロンド形式、変奏形式、ソナタ形式など、様々な形式をサポートすることができる。
論文参考訳（メタデータ） (2022-08-30T15:44:15Z)
Re-creation of Creations: A New Paradigm for Lyric-to-Melody Generation [158.54649047794794]
Re-creation of Creations (ROC)は、歌詞からメロディ生成のための新しいパラダイムである。 ROCは、Lyric-to-Meody生成において、優れたLyric-Meody特徴アライメントを実現する。
論文参考訳（メタデータ） (2022-08-11T08:44:47Z)
Structure-Enhanced Pop Music Generation via Harmony-Aware Learning [20.06867705303102]
構造強化されたポップ・ミュージック・ジェネレーションに調和学習を活用することを提案する。主観的・客観的評価の結果,Harmony-Aware Hierarchical Music Transformer (HAT) が生成した楽曲の質を著しく向上させることが示された。
論文参考訳（メタデータ） (2021-09-14T05:04:13Z)
Controllable deep melody generation via hierarchical music structure representation [14.891975420982511]
MusicFrameworksは階層的な音楽構造表現であり、フル長のメロディを作成するための多段階の生成プロセスである。各フレーズでメロディを生成するために、2つの異なるトランスフォーマーベースネットワークを用いてリズムとベーシックメロディを生成する。さまざまな曲をカスタマイズしたり追加したりするために、音楽フレームワークのコード、基本的なメロディ、リズム構造を変更して、それに応じてネットワークがメロディを生成する。
論文参考訳（メタデータ） (2021-09-02T01:31:14Z)
MusicBERT: Symbolic Music Understanding with Large-Scale Pre-Training [97.91071692716406]
シンボリック・ミュージックの理解(シンボリック・ミュージックの理解)とは、シンボリック・データから音楽を理解することを指す。 MusicBERTは、音楽理解のための大規模な事前訓練モデルである。
論文参考訳（メタデータ） (2021-06-10T10:13:05Z)
Sequence Generation using Deep Recurrent Networks and Embeddings: A study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文参考訳（メタデータ） (2020-12-02T14:19:19Z)
Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文参考訳（メタデータ） (2020-10-28T02:35:40Z)
Music Generation with Temporal Structure Augmentation [0.0]
提案手法は,歌の結末をカウントダウンしたコネクショニスト生成モデルと,余分な入力特徴としてメーターマーカーを付加する。 LSTMセルを持つRNNアーキテクチャは、教師付きシーケンス学習設定でノッティンガムフォークミュージックデータセットに基づいて訓練される。実験では、両方のアノテーションの予測性能が改善された。
論文参考訳（メタデータ） (2020-04-21T19:19:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。