論文の概要: Choir Transformer: Generating Polyphonic Music with Relative Attention
on Transformer
- arxiv url: http://arxiv.org/abs/2308.02531v1
- Date: Tue, 1 Aug 2023 06:44:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 01:09:33.976961
- Title: Choir Transformer: Generating Polyphonic Music with Relative Attention
on Transformer
- Title(参考訳): 合唱トランスフォーマ:トランスフォーマに相対的に注意を向けたポリフォニック音楽の生成
- Authors: Jiuyang Zhou, Hong Zhu, Xingping Wang
- Abstract要約: そこで我々はChoir Transformerというポリフォニック音楽生成ニューラルネットワークを提案する。
Choir Transformerのパフォーマンスは、以前の最先端の精度4.06%を上回っている。
実際に、生成されたメロディとリズムを所定の入力に応じて調整することができる。
- 参考スコア(独自算出の注目度): 4.866650264773479
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Polyphonic music generation is still a challenge direction due to its correct
between generating melody and harmony. Most of the previous studies used
RNN-based models. However, the RNN-based models are hard to establish the
relationship between long-distance notes. In this paper, we propose a
polyphonic music generation neural network named Choir Transformer[
https://github.com/Zjy0401/choir-transformer], with relative positional
attention to better model the structure of music. We also proposed a music
representation suitable for polyphonic music generation. The performance of
Choir Transformer surpasses the previous state-of-the-art accuracy of 4.06%. We
also measures the harmony metrics of polyphonic music. Experiments show that
the harmony metrics are close to the music of Bach. In practical application,
the generated melody and rhythm can be adjusted according to the specified
input, with different styles of music like folk music or pop music and so on.
- Abstract(参考訳): ポリフォニック音楽の生成は、メロディとハーモニーの生成が正しいため、依然として挑戦的な方向である。
以前の研究のほとんどはRNNベースのモデルを使用していた。
しかし、RNNベースのモデルは長距離音符の関係を確立するのが難しい。
本稿では,Choir Transformer[ https://github.com/Zjy0401/choir-transformer]という名前のポリフォニック音楽生成ニューラルネットワークを提案する。
また,ポリフォニック音楽生成に適した音楽表現も提案した。
Choir Transformerのパフォーマンスは、以前の最先端の精度4.06%を上回っている。
また,ポリフォニック音楽の調和度を測定した。
実験により、ハーモニー計量はバッハの音楽に近いことが示されている。
実用的な用途では、生成されたメロディやリズムを、民俗音楽やポップ音楽などの異なるスタイルで、所定の入力に応じて調整することができる。
関連論文リスト
- CoCoFormer: A controllable feature-rich polyphonic music generation
method [2.501600004190393]
本稿では,コードとリズムの入力をきめ細かいレベルで制御することで,モデルの出力を制御するコンディション合唱変換器(CoCoFormer)を提案する。
本稿では,CoCoFormerが現在のモデルよりも優れたレベルに達したことを実証する。
論文 参考訳(メタデータ) (2023-10-15T14:04:48Z) - Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。
以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文 参考訳(メタデータ) (2023-06-08T15:31:05Z) - Multi-Genre Music Transformer -- Composing Full Length Musical Piece [0.0]
このプロジェクトの目的は,より適応的な学習プロセスを通じて楽曲の制作を学ぶマルチジェネラルトランスフォーマーを実装することである。
我々は多言語複合語データセットを構築し、このデータセットに基づいて訓練した線形変換器を実装した。
私たちはこのMulti-Genre Transformerと呼んでいます。
論文 参考訳(メタデータ) (2023-01-06T05:27:55Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - Museformer: Transformer with Fine- and Coarse-Grained Attention for
Music Generation [138.74751744348274]
本研究では,音楽生成に新たな細粒度・粗粒度対応トランスフォーマーであるMuseformerを提案する。
具体的には、細かな注意を払って、特定のバーのトークンは、音楽構造に最も関係のあるバーのトークンに、直接参加する。
粗い注意を払って、トークンは計算コストを減らすために、それぞれのトークンではなく他のバーの要約にのみ参加する。
論文 参考訳(メタデータ) (2022-10-19T07:31:56Z) - Chord-Conditioned Melody Choralization with Controllable Harmonicity and
Polyphonicity [75.02344976811062]
メロディ合唱(メロディの合唱)、すなわちユーザ・ギヴン・メロディに基づく4パートの合唱は、長い間J.S.バッハ合唱と密接に関連していた。
以前のニューラルネットワークベースのシステムは、コード進行を前提としたコラール生成にはほとんど注目しなかった。
コード進行に条件付きメロディのための4パート合唱を生成できるメロディ合唱システムであるDeepChoirを提案する。
論文 参考訳(メタデータ) (2022-02-17T02:59:36Z) - Calliope -- A Polyphonic Music Transformer [9.558051115598657]
ポリフォニック音楽のマルチトラックシーケンスを効率的にモデル化するためのトランスフォーマーに基づく新しいオートエンコーダモデルCalliopeを提案する。
実験により,我々のモデルは,音楽シーケンスの再構築と生成における技術状況を改善することができることが示された。
論文 参考訳(メタデータ) (2021-07-08T08:18:57Z) - MuseMorphose: Full-Song and Fine-Grained Music Style Transfer with Just
One Transformer VAE [36.9033909878202]
トランスフォーマーと可変オートエンコーダ(VAE)は、シンボリック(例えばMIDI)ドメイン音楽生成に広く採用されている。
本稿では,両強みを示す単一のモデルを構築するために,この2つをまとめることに興味がある。
実験により、musemorphoseはrecurrent neural network(rnn)よりも多くのスタイル転送タスクで広く使われているメトリクスを先行技術で上回っていることが示されている。
論文 参考訳(メタデータ) (2021-05-10T03:44:03Z) - PopMAG: Pop Music Accompaniment Generation [190.09996798215738]
単一シーケンスでの同時マルチトラック生成が可能なMUlti-track MIDI表現(MuMIDI)を提案する。
MuMIDIはシーケンス長を拡大し、長期音楽モデリングの新しい課題をもたらす。
我々は,ポップミュージックの伴奏生成をPopMAGと呼ぶ。
論文 参考訳(メタデータ) (2020-08-18T02:28:36Z) - RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement
Learning [69.20460466735852]
本稿では,オンライン伴奏生成のための深層強化学習アルゴリズムを提案する。
提案アルゴリズムは人体に応答し,メロディック,ハーモニック,多種多様な機械部品を生成する。
論文 参考訳(メタデータ) (2020-02-08T03:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。