Fugu-MT 論文翻訳(概要): MMM : Exploring Conditional Multi-Track Music Generation with the Transformer

論文の概要: MMM : Exploring Conditional Multi-Track Music Generation with the Transformer

arxiv url: http://arxiv.org/abs/2008.06048v2
Date: Thu, 20 Aug 2020 19:13:39 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-31 00:05:25.260032
Title: MMM : Exploring Conditional Multi-Track Music Generation with the Transformer
Title（参考訳）: MMM : 変圧器を用いた条件付きマルチトラック音楽の探索
Authors: Jeff Ens, Philippe Pasquier
Abstract要約: マルチトラック音楽を生成することができるトランスフォーマーアーキテクチャに基づく生成システムを提案する。我々は、各トラックといくつかのトラックについて、時間順に順序付けされた音楽イベントのシーケンスを1つのシーケンスに生成する。これによりTransformerの注意機構が利用でき、長期的依存関係を十分に処理できる。
参考スコア（独自算出の注目度）: 9.569049935824227
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose the Multi-Track Music Machine (MMM), a generative system based on the Transformer architecture that is capable of generating multi-track music. In contrast to previous work, which represents musical material as a single time-ordered sequence, where the musical events corresponding to different tracks are interleaved, we create a time-ordered sequence of musical events for each track and concatenate several tracks into a single sequence. This takes advantage of the Transformer's attention-mechanism, which can adeptly handle long-term dependencies. We explore how various representations can offer the user a high degree of control at generation time, providing an interactive demo that accommodates track-level and bar-level inpainting, and offers control over track instrumentation and note density.
Abstract（参考訳）: 本稿では,マルチトラック音楽を生成する変圧器アーキテクチャに基づく生成システムであるマルチトラック音楽機械(mmm)を提案する。それまでの楽曲を、異なるトラックに対応する音楽イベントをインターリーブする単一の時系列シーケンスとして表現していたのに対し、各トラックに対する音楽イベントの時系列シーケンスを作成し、複数のトラックを1つのシーケンスにまとめる。これによりTransformerの注意機構が利用でき、長期的依存関係を十分に処理できる。様々な表現がユーザに対して,生成時の高レベルなコントロールを提供し,トラックレベルとバーレベルのインペインティングに対応するインタラクティブなデモを提供し,トラックのインスツルメンテーションとノート密度のコントロールを提供する。

関連論文リスト

SongGen: A Single Stage Auto-regressive Transformer for Text-to-Song Generation [75.86473375730392]
SongGenは、コントロール可能な曲を生成するための、完全なオープンソースでシングルステージの自動回帰トランスフォーマーである。音声と伴奏の混合を生成する混合モードと、それらを別々に合成するデュアルトラックモードの2つの出力モードをサポートする。コミュニティの関与と今後の研究を促進するため、私たちは、モデルの重み付け、トレーニングコード、注釈付きデータ、前処理パイプラインをリリースします。
論文参考訳（メタデータ） (2025-02-18T18:52:21Z)
MIDI-GPT: A Controllable Generative Model for Computer-Assisted Multitrack Music Composition [4.152843247686306]
MIDI-GPTはコンピュータ支援音楽合成のための生成システムである。楽器の種類、音楽スタイル、音の密度、ポリフォニーレベル、音の持続時間などの属性を条件付けできる。本研究では,MIDI-GPTがトレーニング対象の音楽素材の複製を一貫して回避し,トレーニングデータセットとスタイリスティックに類似した音楽を生成し,属性制御が生成した素材に様々な制約を課すことを実証する実験結果を示す。
論文参考訳（メタデータ） (2025-01-28T15:17:36Z)
UniMuMo: Unified Text, Music and Motion Generation [57.72514622935806]
任意のテキスト,音楽,動作データを入力条件として取り込んで,3つのモードすべてにまたがる出力を生成する,統一型マルチモーダルモデルUniMuMoを導入する。音楽、動き、テキストをトークンベースの表現に変換することで、我々のモデルはエンコーダ・デコーダ・トランスフォーマアーキテクチャを通じてこれらのモダリティをブリッジする。
論文参考訳（メタデータ） (2024-10-06T16:04:05Z)
BandControlNet: Parallel Transformers-based Steerable Popular Music Generation with Fine-Grained Spatiotemporal Features [19.284531698181116]
BandControlNetは、複数の音楽シーケンスに対処し、与えられた時間的制御機能に合わせた高品質な音楽サンプルを生成するように設計されている。提案したBandControlNetは、ほとんどの客観的指標において、忠実度と推論速度の点で他の条件付き音楽生成モデルよりも優れている。短いデータセットでトレーニングされた主観評価は、最先端のモデルに匹敵する品質の音楽を生成できるが、BandControlNetでは大幅にパフォーマンスが向上する。
論文参考訳（メタデータ） (2024-07-15T06:33:25Z)
Multi-view MidiVAE: Fusing Track- and Bar-view Representations for Long Multi-track Symbolic Music Generation [50.365392018302416]
長い多トラックのシンボリック・ミュージックを効果的にモデル化・生成するVAE手法の先駆者の一つであるMulti-view MidiVAEを提案する。我々は,ハイブリッドな変分符号化・復号化戦略を用いて,楽器の特徴と調和,および楽曲のグローバルおよびローカルな情報に焦点をあてる。
論文参考訳（メタデータ） (2024-01-15T08:41:01Z)
Anticipatory Music Transformer [60.15347393822849]
本稿では、時間点過程の制御可能な生成モデルを構築する方法である予測を導入する。コントロールはイベント自体のサブセットであるので、コントロールタスクの充実に重点を置いています。大規模かつ多様なLakh MIDI音楽データセットを用いて予測入出力モデルを訓練する。
論文参考訳（メタデータ） (2023-06-14T16:27:53Z)
Simple and Controllable Music Generation [94.61958781346176]
MusicGenは単一の言語モデル(LM)であり、圧縮された離散的な音楽表現、すなわちトークンの複数のストリームで動作する。以前の作業とは異なり、MusicGenはシングルステージのトランスフォーマーLMと効率的なトークンインターリービングパターンで構成されている。
論文参考訳（メタデータ） (2023-06-08T15:31:05Z)
Unified Sequence-to-Sequence Learning for Single- and Multi-Modal Visual Object Tracking [64.28025685503376]
SeqTrackは、ビジュアルトラッキングをシーケンス生成タスクとしてキャストし、オブジェクト境界ボックスを自動回帰的に予測する。 SeqTrackv2は補助モダリティのための統一インターフェースとタスクを指定するためのタスクプロンプトトークンのセットを統合している。このシーケンス学習パラダイムは、トラッキングフレームワークを単純化するだけでなく、14の挑戦的なベンチマークで優れたパフォーマンスを示す。
論文参考訳（メタデータ） (2023-04-27T17:56:29Z)
Multitrack Music Transformer [36.91519546327085]
短いシーケンス長を維持しながら多様な楽器のセットを表現できる新しいマルチトラック音楽表現を提案する。提案するMultitrack Music Transformer (MMT) は,最先端システムと同等の性能を実現する。
論文参考訳（メタデータ） (2022-07-14T15:06:37Z)
MusIAC: An extensible generative framework for Music Infilling Applications with multi-level Control [11.811562596386253]
埋め込み(いんふ)とは、周囲のマルチトラック音楽に与えられた音楽セクションを生成する作業のこと。提案するフレームワークは、バーごとのトーン張力やポリフォニーレベルの追跡といった制御トークンの追加として、新しい制御トークンである。インタラクティブな生成を可能にするために,Google Colabノートブックにモデルを提示する。
論文参考訳（メタデータ） (2022-02-11T10:02:21Z)
MuseMorphose: Full-Song and Fine-Grained Music Style Transfer with Just One Transformer VAE [36.9033909878202]
トランスフォーマーと可変オートエンコーダ(VAE)は、シンボリック(例えばMIDI)ドメイン音楽生成に広く採用されている。本稿では,両強みを示す単一のモデルを構築するために,この2つをまとめることに興味がある。実験により、musemorphoseはrecurrent neural network(rnn)よりも多くのスタイル転送タスクで広く使われているメトリクスを先行技術で上回っていることが示されている。
論文参考訳（メタデータ） (2021-05-10T03:44:03Z)
Multi-Instrumentalist Net: Unsupervised Generation of Music from Body Movements [20.627164135805852]
本研究では、楽器を演奏するミュージシャンの入力体の動きを取り入れ、教師なしの環境で音楽を生成する新しいシステムを提案する。ログ・スペクトログラムから様々な楽器音楽の離散的な潜在表現を学習するパイプライン「Multi-instrumentalistNet」を構築した。 Midiは、パイプラインがビデオ内の楽器によって演奏される音楽の正確なコンテンツを生成するように、潜在空間をさらに調整できることを示しています。
論文参考訳（メタデータ） (2020-12-07T06:54:10Z)
PopMAG: Pop Music Accompaniment Generation [190.09996798215738]
単一シーケンスでの同時マルチトラック生成が可能なMUlti-track MIDI表現(MuMIDI)を提案する。 MuMIDIはシーケンス長を拡大し、長期音楽モデリングの新しい課題をもたらす。我々は,ポップミュージックの伴奏生成をPopMAGと呼ぶ。
論文参考訳（メタデータ） (2020-08-18T02:28:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。