論文の概要: Medley2K: A Dataset of Medley Transitions
- arxiv url: http://arxiv.org/abs/2008.11159v1
- Date: Tue, 25 Aug 2020 16:46:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 04:41:34.349658
- Title: Medley2K: A Dataset of Medley Transitions
- Title(参考訳): Medley2K: メドレー遷移のデータセット
- Authors: Lukas Faber, Sandro Luck, Damian Pascual, Andreas Roth, Gino Brunner
and Roger Wattenhofer
- Abstract要約: 2,000のメドレーと7,712のラベル付き遷移からなるMedley2Kというデータセットを利用可能にしています。
私たちのデータセットは、さまざまなジャンルのさまざまな曲の遷移を特徴としている。
- 参考スコア(独自算出の注目度): 12.276281998447077
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automatic generation of medleys, i.e., musical pieces formed by different
songs concatenated via smooth transitions, is not well studied in the current
literature. To facilitate research on this topic, we make available a dataset
called Medley2K that consists of 2,000 medleys and 7,712 labeled transitions.
Our dataset features a rich variety of song transitions across different music
genres. We provide a detailed description of this dataset and validate it by
training a state-of-the-art generative model in the task of generating
transitions between songs.
- Abstract(参考訳): メドレーの自動生成、すなわち、滑らかな遷移によって連結された異なる歌によって形成された楽曲は、現在の文献ではよく研究されていない。
このトピックの研究を容易にするために、2000のメドレーと7,712のラベル付き遷移からなるMedley2Kというデータセットを利用可能にしました。
私たちのデータセットは、さまざまなジャンルのさまざまな曲の遷移を特徴としている。
このデータセットの詳細な説明と、曲間の遷移を生成するタスクにおいて、最先端の生成モデルを訓練して検証する。
関連論文リスト
- LARP: Language Audio Relational Pre-training for Cold-Start Playlist Continuation [49.89372182441713]
マルチモーダルコールドスタートプレイリスト継続モデルであるLARPを導入する。
我々のフレームワークはタスク固有の抽象化の段階を増大させており、イントラトラック(音声)コントラスト損失、トラックトラックコントラスト損失、トラックプレイリストコントラスト損失である。
論文 参考訳(メタデータ) (2024-06-20T14:02:15Z) - MOSA: Music Motion with Semantic Annotation Dataset for Cross-Modal Music Processing [3.3162176082220975]
高品質な3次元モーションキャプチャーデータ、アライメント音声記録、ピッチ、ビート、フレーズ、動的、調音、ハーモニーを含むMOSA(Music mOtion with Semantic )データセットを23人のプロミュージシャンによる742のプロ音楽演奏に対して提示する。
私たちの知る限り、これはこれまでのノートレベルのアノテーションを備えた、最大のクロスモーダルな音楽データセットです。
論文 参考訳(メタデータ) (2024-06-10T15:37:46Z) - MidiCaps: A large-scale MIDI dataset with text captions [6.806050368211496]
本研究の目的は,LLMとシンボリック音楽を組み合わせることで,テキストキャプションを付加した最初の大規模MIDIデータセットを提示することである。
近年のキャプション技術の発展に触発されて,テキスト記述付き168kのMIDIファイルをキュレートしたデータセットを提示する。
論文 参考訳(メタデータ) (2024-06-04T12:21:55Z) - QA-MDT: Quality-aware Masked Diffusion Transformer for Enhanced Music Generation [46.301388755267986]
本稿では,高品質な学習戦略を取り入れた高品質音楽生成のための新しいパラダイムを提案する。
我々はまず,TTMタスクにマスク付き拡散トランスフォーマー(MDT)モデルを適用し,その品質管理能力と音楽性の向上を実証した。
実験では、MusicCapsとSong-Describerデータセット上でのSOTA(State-of-the-art)のパフォーマンスを実証した。
論文 参考訳(メタデータ) (2024-05-24T18:09:27Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - Melody transcription via generative pre-training [86.08508957229348]
メロディの書き起こしの鍵となる課題は、様々な楽器のアンサンブルや音楽スタイルを含む幅広いオーディオを処理できる方法を構築することである。
この課題に対処するために、広帯域オーディオの生成モデルであるJukebox(Dhariwal et al. 2020)の表現を活用する。
広義音楽のクラウドソースアノテーションから50ドル(約5,400円)のメロディ書き起こしを含む新しいデータセットを導出する。
論文 参考訳(メタデータ) (2022-12-04T18:09:23Z) - ComMU: Dataset for Combinatorial Music Generation [20.762884001498627]
Combinatorの音楽生成は、音楽の短いサンプルと豊かな音楽メタデータを生成し、それらを組み合わせて完全な音楽を生成する。
ComMUは、短い音楽サンプルとそれに対応する12の音楽メタデータからなる最初のシンボリック音楽データセットである。
以上の結果から,トラックロールやコード品質などのユニークなメタデータが自動合成の能力を向上させることが示唆された。
論文 参考訳(メタデータ) (2022-11-17T07:25:09Z) - MATT: A Multiple-instance Attention Mechanism for Long-tail Music Genre
Classification [1.8275108630751844]
不均衡音楽ジャンル分類は音楽情報検索(MIR)分野において重要な課題である。
既存のモデルのほとんどは、クラスバランスの音楽データセット用に設計されている。
末尾クラスを特定するために,MATT(Multi-Instance Attention)と呼ばれる新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2022-09-09T03:52:44Z) - Music Sentiment Transfer [77.99182201815763]
音楽の感情伝達は、感情伝達の高レベルな目的を音楽領域に適用しようとする。
ネットワークを利用するためには,音楽フォーマットとしてシンボル的MIDIデータを用いる。
その結果,音楽の時間的特性から,感情伝達の課題はイメージの感情伝達よりも難しいことが示唆された。
論文 参考訳(メタデータ) (2021-10-12T06:51:38Z) - PopMAG: Pop Music Accompaniment Generation [190.09996798215738]
単一シーケンスでの同時マルチトラック生成が可能なMUlti-track MIDI表現(MuMIDI)を提案する。
MuMIDIはシーケンス長を拡大し、長期音楽モデリングの新しい課題をもたらす。
我々は,ポップミュージックの伴奏生成をPopMAGと呼ぶ。
論文 参考訳(メタデータ) (2020-08-18T02:28:36Z) - POP909: A Pop-song Dataset for Music Arrangement Generation [10.0454303747519]
POP909はプロのミュージシャンが作成した909曲のピアノ編曲の複数バージョンを含むデータセットである。
データセットの本体は、音声メロディ、リード楽器メロディ、および元のオーディオファイルに整列したMIDIフォーマットで各曲のピアノ伴奏を含む。
我々はテンポ、ビート、キー、コードなどのアノテーションを提供し、テンポ曲線は手作業でラベル付けされ、その他はMIRアルゴリズムによって行われる。
論文 参考訳(メタデータ) (2020-08-17T08:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。