論文の概要: Generating Lead Sheets with Affect: A Novel Conditional seq2seq
Framework
- arxiv url: http://arxiv.org/abs/2104.13056v1
- Date: Tue, 27 Apr 2021 09:04:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-28 13:17:30.184111
- Title: Generating Lead Sheets with Affect: A Novel Conditional seq2seq
Framework
- Title(参考訳): 影響のあるリードシートの生成:新しい条件付きseq2seqフレームワーク
- Authors: Dimos Makris, Kat R. Agres, Dorien Herremans
- Abstract要約: 本稿では,リードシート内のコード進行の正負性や負性性を計算するための新しい手法を提案する。
私たちのアプローチは、シーケンス・トゥ・シークエンスアーキテクチャのエンコーダ部分に高レベルの条件を含むため、ニューラルネットワーク翻訳(NMT)問題に似ています。
提案された戦略は、制御可能な方法でリードシートを生成することができ、トレーニングデータセットのそれに似た音楽属性の分布をもたらす。
- 参考スコア(独自算出の注目度): 3.029434408969759
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The field of automatic music composition has seen great progress in the last
few years, much of which can be attributed to advances in deep neural networks.
There are numerous studies that present different strategies for generating
sheet music from scratch. The inclusion of high-level musical characteristics
(e.g., perceived emotional qualities), however, as conditions for controlling
the generation output remains a challenge. In this paper, we present a novel
approach for calculating the valence (the positivity or negativity of the
perceived emotion) of a chord progression within a lead sheet, using
pre-defined mood tags proposed by music experts. Based on this approach, we
propose a novel strategy for conditional lead sheet generation that allows us
to steer the music generation in terms of valence, phrasing, and time
signature. Our approach is similar to a Neural Machine Translation (NMT)
problem, as we include high-level conditions in the encoder part of the
sequence-to-sequence architectures used (i.e., long-short term memory networks,
and a Transformer network). We conducted experiments to thoroughly analyze
these two architectures. The results show that the proposed strategy is able to
generate lead sheets in a controllable manner, resulting in distributions of
musical attributes similar to those of the training dataset. We also verified
through a subjective listening test that our approach is effective in
controlling the valence of a generated chord progression.
- Abstract(参考訳): オートマチック・ミュージック・コンポジションの分野はここ数年で大きな進歩を遂げており、その多くはディープ・ニューラル・ネットワークの進歩によるものである。
スクラッチから楽譜を生成するための異なる戦略を示す多くの研究がある。
しかし、高レベルの音楽的特徴(例えば、感情的な特性)を、生成出力を制御するための条件として含めることは、依然として課題である。
本稿では,リードシート内のコード進行の価(知覚感情の正負性)を,音楽専門家が提案する事前定義された気分タグを用いて計算する手法を提案する。
提案手法では,楽譜生成のための条件付きリードシート生成手法を提案する。
我々のアプローチはニューラルネットワーク翻訳(nmt)の問題と似ており、使用するシーケンス・ツー・シーケンスアーキテクチャ(すなわち、長期記憶ネットワークとトランスフォーマーネットワーク)のエンコーダ部分に高レベルな条件を含む。
この2つのアーキテクチャを徹底的に解析する実験を行った。
その結果,提案手法は鉛シートを制御可能な方法で生成することができ,その結果,学習データセットと類似した音楽属性の分布が得られた。
また,提案手法が生成したコード進行量の制御に有効であることを主観的聴取テストを通じて検証した。
関連論文リスト
- MuseBarControl: Enhancing Fine-Grained Control in Symbolic Music Generation through Pre-Training and Counterfactual Loss [51.85076222868963]
制御信号と対応する音楽トークンを直接リンクする事前学習タスクを導入する。
次に、生成した音楽と制御プロンプトとの整合性を向上する新たな対実的損失を実現する。
論文 参考訳(メタデータ) (2024-07-05T08:08:22Z) - Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。
以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文 参考訳(メタデータ) (2023-06-08T15:31:05Z) - SeCo: Separating Unknown Musical Visual Sounds with Consistency Guidance [88.0355290619761]
この作品は未知の楽器の分離に焦点を当てている。
本稿では,未知のカテゴリを分離できるセコ(SeCo)フレームワークを提案する。
本手法は,新たな楽曲カテゴリに適応する能力を示し,基本手法を顕著なマージンで上回る性能を示す。
論文 参考訳(メタデータ) (2022-03-25T09:42:11Z) - FIGARO: Generating Symbolic Music with Fine-Grained Artistic Control [25.95359681751144]
本稿では,グローバルレベルできめ細かな制御可能生成が可能な自己教師型記述系列タスクを提案する。
そこで本研究では、ターゲットシーケンスに関する高レベル特徴を抽出し、対応する高レベル記述が与えられたシーケンスの条件分布を、シーケンス・ツー・シーケンス・モデリング・セットアップで学習する。
学習された高次特徴と、強い帰納バイアスとして機能するドメイン知識を組み合わせることで、制御可能なシンボリック音楽生成の最先端結果を実現し、トレーニング分布をはるかに越えて一般化する。
論文 参考訳(メタデータ) (2022-01-26T13:51:19Z) - Hierarchical Recurrent Neural Networks for Conditional Melody Generation
with Long-term Structure [0.0]
階層型リカレントニューラルネットワークを用いた条件付きメロディ生成モデルを提案する。
このモデルは、与えられたコード伴奏に基づいて長期構造を持つメロディーを生成する。
聴取試験の結果,CM-HRNNは長期的構造と総合評価においてアテンションRNNよりも優れていた。
論文 参考訳(メタデータ) (2021-02-19T08:22:26Z) - Sequence Generation using Deep Recurrent Networks and Embeddings: A
study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。
提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文 参考訳(メタデータ) (2020-12-02T14:19:19Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z) - On Long-Tailed Phenomena in Neural Machine Translation [50.65273145888896]
最先端のニューラルネットワーク翻訳(NMT)モデルは、低周波トークンの生成に苦労する。
条件付きテキスト生成における構造的依存関係にモデルトレーニングを適応させるために,新たな損失関数である反焦点損失を提案する。
提案手法は,複数の機械翻訳(MT)データセットに対して有効であり,クロスエントロピーよりも顕著に向上することを示す。
論文 参考訳(メタデータ) (2020-10-10T07:00:57Z) - Learning Interpretable Representation for Controllable Polyphonic Music
Generation [5.01266258109807]
我々は、ポリフォニック音楽の2つの解釈可能な潜在要素である和音とテクスチャを効果的に学習する新しいアーキテクチャを設計する。
このようなコード・テクスチャ・ディコンタングルメントは,広い範囲の応用につながる制御可能な生成経路を提供することを示す。
論文 参考訳(メタデータ) (2020-08-17T07:11:16Z) - Music FaderNets: Controllable Music Generation Based On High-Level
Features via Low-Level Feature Modelling [5.88864611435337]
限られたデータ量で高レベルの特徴表現を学習できるフレームワークを提案する。
提案するフレームワークをMusic FaderNetsと呼び,低レベルの属性を継続的に操作できるという事実から着想を得た。
本モデルでは, 覚醒特性とそれに対応する低レベル属性の固有関係をうまく学習できることを実証する。
論文 参考訳(メタデータ) (2020-07-29T16:01:45Z) - Modeling Musical Structure with Artificial Neural Networks [0.0]
音楽構造モデリングのさまざまな側面に対する人工知能の適用について検討する。
Gated Autoencoder(GAE)というコネクショナリストモデルを用いて,楽曲の断片間の変換を学習する方法を示す。
本稿では,ポリフォニック・ミュージックを区間の連続として表現するGAEの特別な予測訓練を提案する。
論文 参考訳(メタデータ) (2020-01-06T18:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。