論文の概要: Symbolic music generation conditioned on continuous-valued emotions
- arxiv url: http://arxiv.org/abs/2203.16165v1
- Date: Wed, 30 Mar 2022 09:38:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 16:24:50.768894
- Title: Symbolic music generation conditioned on continuous-valued emotions
- Title(参考訳): 連続的感情に基づくシンボリック音楽の生成
- Authors: Serkan Sulun, Matthew E. P. Davies, Paula Viana
- Abstract要約: 音楽的感情によって駆動される多構造シンボリック音楽の創出のための新しいアプローチを提案する。
われわれのアプローチの目新しいところは、最先端のトランスフォーマーの条件付けにある。
感情ラベルと組み合わせたシンボル音楽の大規模データセットを提供する。
- 参考スコア(独自算出の注目度): 1.704504466512536
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper we present a new approach for the generation of
multi-instrument symbolic music driven by musical emotion. The principal
novelty of our approach centres on conditioning a state-of-the-art transformer
based on continuous-valued valence and arousal labels. In addition, we provide
a new large-scale dataset of symbolic music paired with emotion labels in terms
of valence and arousal. We evaluate our approach in a quantitative manner in
two ways, first by measuring its note prediction accuracy, and second via a
regression task in the valence-arousal plane. Our results demonstrate that our
proposed approaches outperform conditioning using control tokens which is
representative of the current state of the art.
- Abstract(参考訳): 本稿では,音楽的感情を駆動するマルチインストゥルメントシンボリック音楽の生成のための新しいアプローチを提案する。
提案手法の主な特徴は,連続値と覚醒ラベルに基づく最先端の変圧器の条件付けである。
さらに,感情ラベルとペアリングされたシンボリック音楽のヴァレンスと覚醒という新たな大規模データセットを提供する。
提案手法を2つの方法で定量的に評価し, 第一に音符予測精度を測定し, 第二にvalence-arousal planeにおける回帰課題を用いて評価した。
提案手法は,現状を表す制御トークンを用いた条件付けよりも優れていることを示す。
関連論文リスト
- ERNIE-Music: Text-to-Waveform Music Generation with Diffusion Models [67.66825818489406]
本稿では拡散モデルの利用を基盤としたテキストから波形への音楽生成モデルを提案する。
本手法は,波形生成プロセスの指針となる条件因子として,自由形式のテキストプロンプトの革新的導入を前提としている。
波形領域における我々の生成した音楽は、多様性、品質、およびテキスト音楽の関連性において、以前の作品よりも大きなマージンで優れていたことを実証する。
論文 参考訳(メタデータ) (2023-02-09T06:27:09Z) - A Domain-Knowledge-Inspired Music Embedding Space and a Novel Attention
Mechanism for Symbolic Music Modeling [0.0]
バイアス調整された正弦波符号化に基づく記号音楽のための基本音楽埋め込み(FME)を提案する。
提案するFMEを利用して, 相対指数, ピッチ, オンセット埋め込みに基づく新しいアテンション機構を提案する。
RIPO変圧器は最先端の変圧器よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-12-02T05:04:31Z) - Unifying the Discrete and Continuous Emotion labels for Speech Emotion
Recognition [28.881092401807894]
音声からの感情検出のためのパラ言語分析では、感情は離散的または次元的(連続的な評価)ラベルと同一視されている。
本研究では,連続的感情特性と離散的感情特性を共同で予測するモデルを提案する。
論文 参考訳(メタデータ) (2022-10-29T16:12:31Z) - Action Quality Assessment with Temporal Parsing Transformer [84.1272079121699]
行動品質評価(AQA)は、作業の理解と解決に重要である。
本稿では,時間的部分表現に包括的特徴を分解する時間的パーシング変換器を提案する。
提案手法は,3つの公開AQAベンチマークにおける先行研究よりもかなりのマージンで優れていた。
論文 参考訳(メタデータ) (2022-07-19T13:29:05Z) - Towards Cross-Cultural Analysis using Music Information Dynamics [7.4517333921953215]
異なる文化の音楽は、2つの面で異なるスタイルのコンベンションを持つことによって異なる美学を確立する。
本稿では,これら2つの側面に着目し,異なる文化の楽曲を定量的に比較する枠組みを提案する。
論文 参考訳(メタデータ) (2021-11-24T16:05:29Z) - MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal
Emotion Recognition [118.73025093045652]
マルチモーダル感情認識のための事前学習モデル textbfMEmoBERT を提案する。
従来の「訓練前、微妙な」パラダイムとは異なり、下流の感情分類タスクをマスク付きテキスト予測として再構成するプロンプトベースの手法を提案する。
提案するMEMOBERTは感情認識性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-10-27T09:57:00Z) - Generating Lead Sheets with Affect: A Novel Conditional seq2seq
Framework [3.029434408969759]
本稿では,リードシート内のコード進行の正負性や負性性を計算するための新しい手法を提案する。
私たちのアプローチは、シーケンス・トゥ・シークエンスアーキテクチャのエンコーダ部分に高レベルの条件を含むため、ニューラルネットワーク翻訳(NMT)問題に似ています。
提案された戦略は、制御可能な方法でリードシートを生成することができ、トレーニングデータセットのそれに似た音楽属性の分布をもたらす。
論文 参考訳(メタデータ) (2021-04-27T09:04:21Z) - Sequence Generation using Deep Recurrent Networks and Embeddings: A
study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。
提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文 参考訳(メタデータ) (2020-12-02T14:19:19Z) - Music FaderNets: Controllable Music Generation Based On High-Level
Features via Low-Level Feature Modelling [5.88864611435337]
限られたデータ量で高レベルの特徴表現を学習できるフレームワークを提案する。
提案するフレームワークをMusic FaderNetsと呼び,低レベルの属性を継続的に操作できるという事実から着想を得た。
本モデルでは, 覚醒特性とそれに対応する低レベル属性の固有関係をうまく学習できることを実証する。
論文 参考訳(メタデータ) (2020-07-29T16:01:45Z) - Visual Attention for Musical Instrument Recognition [72.05116221011949]
本研究では,楽器認識の性能向上を図るため,音節時間感覚における注意機構,すなわち視覚的注意(la visual attention)の活用について検討する。
第1のアプローチは,各音節時間インスタンスに基づく予測をアグリゲーション前に注意重み付けし,最終的な予測を生成するスライディング・ウインドウ・パラダイムに注意機構を適用した。
第2のアプローチは、ネットワークがスペクトログラムの一部にのみ参加し、限られた回数の視覚的注意を前提として、次にどこに出席するかを決定する、反復的な視覚的注意モデルに基づいている。
論文 参考訳(メタデータ) (2020-06-17T03:56:44Z) - MatchGAN: A Self-Supervised Semi-Supervised Conditional Generative
Adversarial Network [51.84251358009803]
本稿では,条件付き生成逆数ネットワーク(GAN)に対する,半教師付き環境下での自己教師型学習手法を提案する。
利用可能な数少ないラベル付きサンプルのラベル空間から無作為なラベルをサンプリングして拡張を行う。
本手法は,ベースラインのトレーニングに使用したラベル付きサンプルの20%に過ぎません。
論文 参考訳(メタデータ) (2020-06-11T17:14:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。