論文の概要: Melody Infilling with User-Provided Structural Context
- arxiv url: http://arxiv.org/abs/2210.02829v1
- Date: Thu, 6 Oct 2022 11:37:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 18:05:18.193794
- Title: Melody Infilling with User-Provided Structural Context
- Title(参考訳): ユーザ提供構造コンテキストによるメロディインフィルディング
- Authors: Chih-Pin Tan, Alvin W.Y. Su and Yi-Hsuan Yang
- Abstract要約: 本稿では,楽譜入力のためのトランスフォーマーを用いた新しいモデルを提案する。
提案モデルでは,構造情報を効果的に活用し,高品質なポップスタイルのメロディを生成可能であることを示す。
- 参考スコア(独自算出の注目度): 37.55332319528369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a novel Transformer-based model for music score
infilling, to generate a music passage that fills in the gap between given past
and future contexts. While existing infilling approaches can generate a passage
that connects smoothly locally with the given contexts, they do not take into
account the musical form or structure of the music and may therefore generate
overly smooth results. To address this issue, we propose a structure-aware
conditioning approach that employs a novel attention-selecting module to supply
user-provided structure-related information to the Transformer for infilling.
With both objective and subjective evaluations, we show that the proposed model
can harness the structural information effectively and generate melodies in the
style of pop of higher quality than the two existing structure-agnostic
infilling models.
- Abstract(参考訳): 本稿では,過去と将来の状況のギャップを埋める音楽通路を生成するために,トランスフォーマーを用いた新しい楽曲入力モデルを提案する。
既存の補充アプローチは、与えられた文脈と局所的にスムーズに接続する経路を生成することができるが、音楽の形式や構造を考慮に入れず、従って過度にスムーズな結果を生み出す可能性がある。
この問題に対処するために,ユーザが提供する構造関連情報をトランスフォーマーに入力するための新しいアテンション選択モジュールを用いた構造対応コンディショニング手法を提案する。
客観評価と主観評価の両面から,提案モデルは構造情報を効果的に活用し,既存の2つの構造に依存しない埋込モデルよりも高い品質のポップスタイルでメロディを生成することができることを示す。
関連論文リスト
- Integrating Text-to-Music Models with Language Models: Composing Long Structured Music Pieces [0.0]
本稿では,テキスト・ツー・ミュージック・モデルと大規模言語モデルを統合することにより,形式付き音楽を生成することを提案する。
実験の結果,提案手法は,高度に構造化され,組織化され,結合性が高い2.5分間の楽曲を生成できることがわかった。
論文 参考訳(メタデータ) (2024-10-01T02:43:14Z) - StemGen: A music generation model that listens [9.489938613869864]
音楽の文脈に耳を傾けたり反応したりできる音楽生成モデルを作成するための代替パラダイムを提案する。
本稿では,非自己回帰型トランスフォーマーモデルアーキテクチャを用いて,そのようなモデルを構築する方法について述べる。
得られたモデルは、最先端のテキスト条件付きモデルの音質に到達し、その文脈と強い音楽的コヒーレンスを示す。
論文 参考訳(メタデータ) (2023-12-14T08:09:20Z) - ERNIE-Music: Text-to-Waveform Music Generation with Diffusion Models [67.66825818489406]
本稿では拡散モデルの利用を基盤としたテキストから波形への音楽生成モデルを提案する。
本手法は,波形生成プロセスの指針となる条件因子として,自由形式のテキストプロンプトの革新的導入を前提としている。
波形領域における我々の生成した音楽は、多様性、品質、およびテキスト音楽の関連性において、以前の作品よりも大きなマージンで優れていたことを実証する。
論文 参考訳(メタデータ) (2023-02-09T06:27:09Z) - SIM-Trans: Structure Information Modeling Transformer for Fine-grained
Visual Categorization [59.732036564862796]
本稿では,オブジェクト構造情報を変換器に組み込んだSIM-Trans(Structure Information Modeling Transformer)を提案する。
提案した2つのモジュールは軽量化されており、任意のトランスフォーマーネットワークにプラグインでき、エンドツーエンドで容易に訓練できる。
実験と解析により,提案したSIM-Transが細粒度視覚分類ベンチマークの最先端性能を達成することを示した。
論文 参考訳(メタデータ) (2022-08-31T03:00:07Z) - Structural Biases for Improving Transformers on Translation into
Morphologically Rich Languages [120.74406230847904]
TP-Transformerは従来のTransformerアーキテクチャを拡張し、構造を表現するコンポーネントを追加する。
第2の方法は、形態的トークン化でデータをセグメント化することで、データレベルで構造を付与する。
これらの2つのアプローチのそれぞれが、ネットワークがより良いパフォーマンスを達成することを可能にすることは分かっていますが、この改善はデータセットのサイズに依存します。
論文 参考訳(メタデータ) (2022-08-11T22:42:24Z) - Generating Coherent Narratives by Learning Dynamic and Discrete Entity
States with a Contrastive Framework [68.1678127433077]
我々はトランスフォーマーモデルを拡張して,物語生成のためのエンティティ状態更新と文実現を動的に行う。
2つのナラティブデータセットの実験により、我々のモデルは強いベースラインよりも一貫性があり多様なナラティブを生成できることが示された。
論文 参考訳(メタデータ) (2022-08-08T09:02:19Z) - A framework to compare music generative models using automatic
evaluation metrics extended to rhythm [69.2737664640826]
本稿では,前回の研究で提示された,リズムを考慮せず,設計決定を下すための枠組みを取り上げ,単音素音楽作成における2つのrnnメモリセルの性能評価のためにリズムサポートを付加した。
モデルでは,音素変換の処理を考慮し,リズムサポートを付加した幾何学に基づく自動計測値を用いて,生成した楽曲の質を評価する。
論文 参考訳(メタデータ) (2021-01-19T15:04:46Z) - Music Generation with Temporal Structure Augmentation [0.0]
提案手法は,歌の結末をカウントダウンしたコネクショニスト生成モデルと,余分な入力特徴としてメーターマーカーを付加する。
LSTMセルを持つRNNアーキテクチャは、教師付きシーケンス学習設定でノッティンガムフォークミュージックデータセットに基づいて訓練される。
実験では、両方のアノテーションの予測性能が改善された。
論文 参考訳(メタデータ) (2020-04-21T19:19:58Z) - Continuous Melody Generation via Disentangled Short-Term Representations
and Structural Conditions [14.786601824794369]
ユーザが指定したシンボリックシナリオと過去の音楽コンテキストを組み合わせることで,メロディーを構成するモデルを提案する。
本モデルでは,8拍子の音符列を基本単位として長い旋律を生成でき,一貫したリズムパターン構造を他の特定の歌と共有することができる。
その結果,本モデルが生成する音楽は,顕著な繰り返し構造,豊かな動機,安定したリズムパターンを有する傾向が示唆された。
論文 参考訳(メタデータ) (2020-02-05T06:23:44Z) - Pop Music Transformer: Beat-based Modeling and Generation of Expressive
Pop Piano Compositions [37.66340344198797]
我々は、既存のトランスフォーマーモデルよりも優れたリズム構造でポップピアノ音楽を構成するポップ・ミュージック・トランスフォーマーを構築した。
特に、入力データにメートル法構造を課すことにより、トランスフォーマーは音楽のビートバーフレーズ階層構造をより容易に認識できるようにする。
論文 参考訳(メタデータ) (2020-02-01T14:12:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。