論文の概要: Composer's Assistant: An Interactive Transformer for Multi-Track MIDI
Infilling
- arxiv url: http://arxiv.org/abs/2301.12525v2
- Date: Fri, 14 Jul 2023 20:53:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-18 23:31:04.273637
- Title: Composer's Assistant: An Interactive Transformer for Multi-Track MIDI
Infilling
- Title(参考訳): Composerのアシスタント:マルチトラックMIDIインフィルのためのインタラクティブトランス
- Authors: Martin E. Malandro
- Abstract要約: Composer's Assistantは、REAPERデジタルオーディオワークステーションにおける対話型ヒューマンコンピュータ合成システムである。
マルチトラックMIDIインフィルのタスクを達成するために,T5ライクなモデルをトレーニングする。
ComposerのAssistantは、REAPERのモデルとのインタラクションを可能にするスクリプトとともに、このモデルで構成されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Composer's Assistant, a system for interactive human-computer
composition in the REAPER digital audio workstation. We consider the task of
multi-track MIDI infilling when arbitrary track-measures have been deleted from
a contiguous slice of measures from a MIDI file, and we train a T5-like model
to accomplish this task. Composer's Assistant consists of this model together
with scripts that enable interaction with the model in REAPER. We conduct
objective and subjective tests of our model. We release our complete system,
consisting of source code, pretrained models, and REAPER scripts. Our models
were trained only on permissively-licensed MIDI files.
- Abstract(参考訳): 本稿では,REAPERデジタルオーディオワークステーションにおける対話型ヒューマンコンピュータ合成システムであるComposer's Assistantを紹介する。
任意のトラック測度がMIDIファイルから連続的なスライスから削除された場合のマルチトラックMIDI埋め込みの課題を考察し、この課題を達成するためにT5ライクなモデルをトレーニングする。
ComposerのAssistantはこのモデルとREAPERのモデルとのインタラクションを可能にするスクリプトで構成されている。
モデルの客観的かつ主観的なテストを行います。
我々はソースコード、事前訓練されたモデル、REAPERスクリプトからなる完全なシステムをリリースする。
我々のモデルは、パーミッシブライセンスMIDIファイルでのみ訓練された。
関連論文リスト
- Composer's Assistant 2: Interactive Multi-Track MIDI Infilling with Fine-Grained User Control [0.0]
ComposerのAssistant 2は、REAPERデジタルオーディオワークステーションにおける人間とコンピュータの対話的な合成システムである。
新しいコントロールは、システムの出力を細かく制御する。
論文 参考訳(メタデータ) (2024-07-19T23:28:09Z) - Accompanied Singing Voice Synthesis with Fully Text-controlled Melody [61.147446955297625]
Text-to-song (TTSong) は、歌声の伴奏を合成する音楽生成タスクである。
完全テキスト制御されたメロディで高品質な曲を生成する最初のTTSongモデルであるMelodyLMを提案する。
論文 参考訳(メタデータ) (2024-07-02T08:23:38Z) - Notochord: a Flexible Probabilistic Model for Real-Time MIDI Performance [0.8192907805418583]
Notochord は構造化事象の列の深い確率モデルである。
ポリフォニックおよびマルチトラックMIDIを生成し、10ミリ秒未満のレイテンシで入力に応答する。
論文 参考訳(メタデータ) (2024-03-18T17:35:02Z) - ByteComposer: a Human-like Melody Composition Method based on Language
Model Agent [11.792129708566598]
大規模言語モデル(LLM)は、マルチモーダル理解と生成タスクの進歩を奨励している。
我々は,人間の創造的パイプラインを4つのステップでエミュレートするエージェントフレームワークByteComposerを提案する。
我々は、GPT4およびオープンソースの大規模言語モデルに関する広範な実験を行い、フレームワークの有効性を実証した。
論文 参考訳(メタデータ) (2024-02-24T04:35:07Z) - DiffMoog: a Differentiable Modular Synthesizer for Sound Matching [48.33168531500444]
DiffMoogはモジュラーシンセサイザーで、一般に商用機器で見られるモジュールの集合を包含する。
差別化が可能であるため、ニューラルネットワークとの統合が可能になり、自動サウンドマッチングが可能になる。
我々はDiffMoogとエンドツーエンドのサウンドマッチングフレームワークを組み合わせたオープンソースのプラットフォームを紹介した。
論文 参考訳(メタデータ) (2024-01-23T08:59:21Z) - MusicAgent: An AI Agent for Music Understanding and Generation with
Large Language Models [54.55063772090821]
MusicAgentは、多数の音楽関連ツールと、ユーザの要求に対処するための自律ワークフローを統合している。
このシステムの第一の目的は、AI音楽ツールの複雑さからユーザーを解放し、クリエイティブな側面に集中できるようにすることである。
論文 参考訳(メタデータ) (2023-10-18T13:31:10Z) - Anticipatory Music Transformer [77.29752896976116]
本稿では、時間点過程の制御可能な生成モデルを構築する方法である予測を導入する。
コントロールはイベント自体のサブセットであるので、コントロールタスクの充実に重点を置いています。
大規模かつ多様なLakh MIDI音楽データセットを用いて予測入出力モデルを訓練する。
論文 参考訳(メタデータ) (2023-06-14T16:27:53Z) - The Chamber Ensemble Generator: Limitless High-Quality MIR Data via
Generative Modeling [6.009299746966725]
本稿では,リッチアノテーションを付加した無制限のリアル・コーラル・ミュージックを制作できるシステムについて述べる。
我々は4つの異なる室内アンサンブルから大規模な合唱曲のデータセットを生成する。
MIRコミュニティにおける今後の作業のためのオープンソース基盤として,システムとデータセットの両方をリリースする。
論文 参考訳(メタデータ) (2022-09-28T22:55:15Z) - Symphony Generation with Permutation Invariant Language Model [57.75739773758614]
変分不変言語モデルに基づくシンフォニーネットという記号的シンフォニー音楽生成ソリューションを提案する。
シンフォニートークンの超長いシーケンスをモデル化するためのバックボーンとして、新しいトランスフォーマーデコーダアーキテクチャが導入された。
実験結果から,提案手法は人間の構成と比べ,コヒーレント,新規,複雑,調和的な交響曲を生成できることが示唆された。
論文 参考訳(メタデータ) (2022-05-10T13:08:49Z) - The Piano Inpainting Application [0.0]
生成アルゴリズムは、提供された制御の制限、推論の禁止、ミュージシャンの生成への統合の欠如のために、依然としてアーティストによって広く使われていない。
本稿では,ピアノ演奏のインペインティングに着目した生成モデルであるピアノ・インペインティング・アプリケーション(PIA)について述べる。
論文 参考訳(メタデータ) (2021-07-13T09:33:11Z) - PopMAG: Pop Music Accompaniment Generation [190.09996798215738]
単一シーケンスでの同時マルチトラック生成が可能なMUlti-track MIDI表現(MuMIDI)を提案する。
MuMIDIはシーケンス長を拡大し、長期音楽モデリングの新しい課題をもたらす。
我々は,ポップミュージックの伴奏生成をPopMAGと呼ぶ。
論文 参考訳(メタデータ) (2020-08-18T02:28:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。