論文の概要: DISCO-10M: A Large-Scale Music Dataset
- arxiv url: http://arxiv.org/abs/2306.13512v2
- Date: Thu, 5 Oct 2023 09:45:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 22:01:48.068082
- Title: DISCO-10M: A Large-Scale Music Dataset
- Title(参考訳): DISCO-10M: 大規模音楽データセット
- Authors: Luca A. Lanzend\"orfer, Florian Gr\"otschla, Emil Funke, Roger
Wattenhofer
- Abstract要約: 本研究では,新しい音楽データセットdisCO-10Mを提案する。
これまでに利用可能な最大の音楽データセットを桁違いに上回っている。
我々は,音楽のための新しい機械学習モデルの開発を促進するために,新しい研究の民主化と促進を目的としている。
- 参考スコア(独自算出の注目度): 20.706469085872516
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Music datasets play a crucial role in advancing research in machine learning
for music. However, existing music datasets suffer from limited size,
accessibility, and lack of audio resources. To address these shortcomings, we
present DISCO-10M, a novel and extensive music dataset that surpasses the
largest previously available music dataset by an order of magnitude. To ensure
high-quality data, we implement a multi-stage filtering process. This process
incorporates similarities based on textual descriptions and audio embeddings.
Moreover, we provide precomputed CLAP embeddings alongside DISCO-10M,
facilitating direct application on various downstream tasks. These embeddings
enable efficient exploration of machine learning applications on the provided
data. With DISCO-10M, we aim to democratize and facilitate new research to help
advance the development of novel machine learning models for music.
- Abstract(参考訳): 音楽データセットは、音楽のための機械学習の研究を進める上で重要な役割を果たす。
しかし、既存の音楽データセットはサイズ、アクセシビリティ、オーディオリソースの不足に苦しんでいる。
これらの欠点に対処するために,従来で最大の楽曲データセットを桁違いに超える,斬新で広範な音楽データセットdisCO-10Mを提案する。
高品質なデータを保証するため,マルチステージフィルタリングプロセスを実装した。
このプロセスには、テキスト記述とオーディオ埋め込みに基づく類似性が含まれている。
さらに, DisCO-10M と併用して事前計算した CLAP 埋め込みを提供し, 様々な下流タスクへの直接適用を容易にする。
これらの埋め込みは、提供されたデータに基づく機械学習アプリケーションの効率的な探索を可能にする。
DISCO-10Mでは、音楽のための新しい機械学習モデルの開発を促進するために、新しい研究の民主化と促進を目的としている。
関連論文リスト
- MuPT: A Generative Symbolic Music Pretrained Transformer [73.47607237309258]
音楽の事前学習におけるLarge Language Models (LLM) の適用について検討する。
生成過程の異なるトラックからの不整合対策に関連する課題に対処するために,SMT-ABC Notation(Synchronized Multi-Track ABC Notation)を提案する。
私たちのコントリビューションには、最大8192個のトークンを処理可能な一連のモデルが含まれており、トレーニングセットの象徴的な音楽データの90%をカバーしています。
論文 参考訳(メタデータ) (2024-04-09T15:35:52Z) - WikiMuTe: A web-sourced dataset of semantic descriptions for music audio [7.4327407361824935]
音楽の豊かな意味記述を含む新しいオープンデータセットWikiMuTeを提案する。
このデータはウィキペディアの豊富な楽曲に関する記事のカタログから得られたものである。
我々は、テキストと音声の表現を共同で学習し、モーダル検索を行うモデルを訓練する。
論文 参考訳(メタデータ) (2023-12-14T18:38:02Z) - Proceedings of the 5th International Workshop on Reading Music Systems [57.35718206110128]
第5回レディング・ミュージック・システムズ国際ワークショップが2023年11月4日にイタリアのミラノで開催された。
ワークショップは、音楽を読むためのシステムを開発する研究者と、そのようなシステムから恩恵を受けることができる他の研究者や実践者とを結びつけることを目的としている。
論文 参考訳(メタデータ) (2023-11-07T16:00:42Z) - Related Rhythms: Recommendation System To Discover Music You May Like [2.7152798636894193]
本稿では, 分散機械学習パイプラインをデライン化し, 歌のサブセットを入力として取り出し, 入力されたサブセットに類似していると認識された曲の新たなサブセットを生成する。
公開されているMillion Songsデータセット(MSD)は、研究者がオーディオトラックの分析とレコメンデーションのための合理的に効率的なシステムを開発し、探索することを可能にする。
提案するアプリケーションの目的は、ユーザーが好む曲を最適に推薦するように訓練されたMLシステムを活用することである。
論文 参考訳(メタデータ) (2023-09-24T04:18:40Z) - Self-Supervised Contrastive Learning for Robust Audio-Sheet Music
Retrieval Systems [3.997809845676912]
自己指導型コントラスト学習は、実際の音楽コンテンツからの注釈付きデータの不足を軽減することができることを示す。
クロスモーダルなピース識別の高レベルなタスクにスニペットを埋め込む。
本研究では,実際の音楽データが存在する場合,検索品質が30%から100%に向上することが観察された。
論文 参考訳(メタデータ) (2023-09-21T14:54:48Z) - A Large-scale Dataset for Audio-Language Representation Learning [54.933479346870506]
本稿では,一連の公開ツールやAPIに基づいた,革新的で自動的な音声キャプション生成パイプラインを提案する。
我々はAuto-ACDという名前の大規模で高品質な音声言語データセットを構築し、190万以上の音声テキストペアからなる。
論文 参考訳(メタデータ) (2023-09-20T17:59:32Z) - MusiLingo: Bridging Music and Text with Pre-trained Language Models for Music Captioning and Query Response [42.73982391253872]
MusiLingoは音楽キャプション生成と音楽関連クエリ応答のための新しいシステムである。
広範囲な音楽キャプションデータセットでトレーニングし、インストラクショナルデータで微調整する。
音楽キャプションの生成と音楽関連Q&Aペアの構成において,その競争性能を実証した。
論文 参考訳(メタデータ) (2023-09-15T19:31:40Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。