論文の概要: SLEEPING-DISCO 9M: A large-scale pre-training dataset for generative music modeling
- arxiv url: http://arxiv.org/abs/2506.14293v1
- Date: Tue, 17 Jun 2025 08:08:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.389193
- Title: SLEEPING-DISCO 9M: A large-scale pre-training dataset for generative music modeling
- Title(参考訳): SLEEPING-DISCO 9M: 生成音楽モデリングのための大規模事前学習データセット
- Authors: Tawsif Ahmed, Andrej Radonjic, Gollam Rabby,
- Abstract要約: 我々の知る限りでは、ジェネレーティブな音楽モデリングタスクに人気がありよく知られた曲を表すオープンソースの高品質なデータセットは存在しない。
我々のデータセットはこの物語を変え、実際のポピュラー音楽と世界有数のアーティストを用いて構築されたデータセットを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Sleeping-DISCO 9M, a large-scale pre-training dataset for music and song. To the best of our knowledge, there are no open-source high-quality dataset representing popular and well-known songs for generative music modeling tasks such as text-music, music-captioning, singing-voice synthesis, melody reconstruction and cross-model retrieval. Past contributions focused on isolated and constrained factors whose core perspective was to create synthetic or re-recorded music corpus (e.g. GTSinger, M4Singer) and arbitrarily large-scale audio datasets (e.g. DISCO-10M and LAIONDISCO-12M) had been another focus for the community. Unfortunately, adoption of these datasets has been below substantial in the generative music community as these datasets fail to reflect real-world music and its flavour. Our dataset changes this narrative and provides a dataset that is constructed using actual popular music and world-renowned artists.
- Abstract(参考訳): 音楽と歌のための大規模事前学習データセットであるSleeping-DISCO 9Mについて述べる。
我々の知る限りでは、テキスト音楽、音楽キャプション、歌声合成、メロディ再構成、クロスモデル検索などの生成音楽モデリングタスクにおいて、ポピュラーで有名な楽曲を表現したオープンソースの高品質なデータセットは存在しない。
音楽コーパス(例えば GTSinger や M4Singer)や大規模オーディオデータセット(例えば DISCO-10M や LAIONDISCO-12M)の作成が中心となる、孤立的で制約された要因に焦点を当てた過去のコントリビューションは、コミュニティにとってもう一つの焦点であった。
残念なことに、これらのデータセットの採用は、実際の音楽とその風味を反映することができないため、生成的音楽コミュニティではそれほど大きくない。
我々のデータセットはこの物語を変え、実際のポピュラー音楽と世界有数のアーティストを用いて構築されたデータセットを提供する。
関連論文リスト
- JamendoMaxCaps: A Large Scale Music-caption Dataset with Imputed Metadata [6.230204066837519]
JamendoMaxCapsは、Jamendoプラットフォームから362,000以上のフリーライセンスのインストゥルメンタルトラックを備えた、大規模なミュージックキャプションデータセットである。
データセットには、最先端のキャプションモデルによって生成されたキャプションが含まれており、暗黙のメタデータで強化されている。
論文 参考訳(メタデータ) (2025-02-11T11:12:19Z) - MuPT: A Generative Symbolic Music Pretrained Transformer [56.09299510129221]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response [42.73982391253872]
MusiLingoは音楽キャプション生成と音楽関連クエリ応答のための新しいシステムである。
広範囲な音楽キャプションデータセットでトレーニングし、インストラクショナルデータで微調整する。
音楽キャプションの生成と音楽関連Q&Aペアの構成において,その競争性能を実証した。
論文 参考訳(メタデータ) (2023-09-15T19:31:40Z) - DISCO-10M: A Large-Scale Music Dataset [20.706469085872516]
本研究では,新しい音楽データセットdisCO-10Mを提案する。
これまでに利用可能な最大の音楽データセットを桁違いに上回っている。
我々は,音楽のための新しい機械学習モデルの開発を促進するために,新しい研究の民主化と促進を目的としている。
論文 参考訳(メタデータ) (2023-06-23T14:27:14Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。