論文の概要: CCMusic: An Open and Diverse Database for Chinese Music Information Retrieval Research
- arxiv url: http://arxiv.org/abs/2503.18802v1
- Date: Mon, 24 Mar 2025 15:47:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:33:14.807611
- Title: CCMusic: An Open and Diverse Database for Chinese Music Information Retrieval Research
- Title(参考訳): CCMusic:中国音楽情報検索研究のためのオープン・ディバースデータベース
- Authors: Monan Zhou, Shenyang Xu, Zhaorui Liu, Zhaowen Wang, Feng Yu, Wei Li, Baoqiang Han,
- Abstract要約: 本稿では,中国音楽に関連するデータセットからなるオープンで多様なデータベースであるCCMusicを紹介する。
データベースは、公開データセットと未公開データセットの両方を統合し、データのクリーニング、ラベルのリファインメント、データ構造の統合といったステップを踏む。
この目的のために開発された統合評価フレームワークを用いて,全データセットのベンチマーク評価を行う。
- 参考スコア(独自算出の注目度): 10.21338709612223
- License:
- Abstract: Data are crucial in various computer-related fields, including music information retrieval (MIR), an interdisciplinary area bridging computer science and music. This paper introduces CCMusic, an open and diverse database comprising multiple datasets specifically designed for tasks related to Chinese music, highlighting our focus on this culturally rich domain. The database integrates both published and unpublished datasets, with steps taken such as data cleaning, label refinement, and data structure unification to ensure data consistency and create ready-to-use versions. We conduct benchmark evaluations for all datasets using a unified evaluation framework developed specifically for this purpose. This publicly available framework supports both classification and detection tasks, ensuring standardized and reproducible results across all datasets. The database is hosted on HuggingFace and ModelScope, two open and multifunctional data and model hosting platforms, ensuring ease of accessibility and usability.
- Abstract(参考訳): データは、音楽情報検索(MIR)、学際的な分野であるコンピュータ科学と音楽の橋渡しなど、様々なコンピュータ関連分野において重要である。
本稿では,中国音楽に関連する課題に特化して設計された複数のデータセットからなるオープンで多様なデータベースCCMusicを紹介する。
データベースは、公開データセットと未公開データセットの両方を統合し、データのクリーニング、ラベルのリファインメント、データ構造統一といったステップを踏んで、データの一貫性を確保し、使用可能なバージョンを作成する。
この目的のために開発された統合評価フレームワークを用いて,全データセットのベンチマーク評価を行う。
この公開フレームワークは、分類タスクと検出タスクの両方をサポートし、すべてのデータセットで標準化された再現可能な結果を保証する。
データベースはHuggingFaceとModelScope上にホストされている。2つのオープンで多機能なデータとモデルホスティングプラットフォームで、アクセシビリティとユーザビリティの確保を目指している。
関連論文リスト
- CloserMusicDB: A Modern Multipurpose Dataset of High Quality Music [79.16635054977068]
人間のチームによって注釈付けされた完全長のスタジオ品質トラックのコレクションであるCloserMusicDBを紹介します。
このデータセットを使用して実行可能な3つのサンプルタスクとともに、データセットの選択した品質について説明する。
論文 参考訳(メタデータ) (2024-10-25T13:11:19Z) - BabelBench: An Omni Benchmark for Code-Driven Analysis of Multimodal and Multistructured Data [61.936320820180875]
大規模言語モデル(LLM)は、様々な領域でますます重要になっている。
BabelBenchは、コード実行によるマルチモーダルなマルチ構造化データ管理におけるLLMの熟練度を評価する革新的なベンチマークフレームワークである。
BabelBenchの実験結果から,ChatGPT 4のような最先端モデルでさえ,大幅な改善の余地があることが示唆された。
論文 参考訳(メタデータ) (2024-10-01T15:11:24Z) - SRFUND: A Multi-Granularity Hierarchical Structure Reconstruction Benchmark in Form Understanding [55.48936731641802]
階層的に構造化されたマルチタスク形式理解ベンチマークであるSRFUNDを提案する。
SRFUNDはオリジナルのFUNSDとXFUNDデータセットの上に洗練されたアノテーションを提供する。
データセットには、英語、中国語、日本語、ドイツ語、フランス語、スペイン語、イタリア語、ポルトガル語を含む8つの言語が含まれている。
論文 参考訳(メタデータ) (2024-06-13T02:35:55Z) - A Hierarchical Approach to exploiting Multiple Datasets from TalkBank [0.0]
本稿では、階層的な探索手法を用いて、効率的な複雑なデータ選択を可能にするパイプラインフレームワークを提案する。
このフレームワークは、他のオープンサイエンスプラットフォームからのデータ処理にも適用できる。
論文 参考訳(メタデータ) (2023-06-21T22:37:51Z) - SANGEET: A XML based Open Dataset for Research in Hindustani Sangeet [1.2891210250935146]
本稿では,ヒンズーシャニサンゲット構成の包括的情報を格納するXMLベースの公開データセットであるSANGEETの構築を試みる。
SANGEETはメタデータ、構造、表記、リズム、メロディ情報を含む任意の構成の必要な情報を全て保存する。
本稿では,XQuery を用いた音楽情報検索,Omenad レンダリングシステムによる可視化などの応用を実演することで,データセットの有用性を示す。
論文 参考訳(メタデータ) (2023-06-07T04:50:09Z) - Cross Modal Data Discovery over Structured and Unstructured Data Lakes [5.270224494298927]
組織はデータ駆動意思決定のために、ますます大量のデータを集めています。
これらのデータは、数千の構造化データセットと非構造化データセットからなる集中型リポジトリにダンプされることが多い。
逆に、そのようなデータセットの混合は、ユーザのクエリや分析タスクに関連する要素を発見することを非常に困難にしている。
論文 参考訳(メタデータ) (2023-06-01T17:34:42Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z) - MusPy: A Toolkit for Symbolic Music Generation [32.01713268702699]
MusPyは、シンボリック音楽生成のためのオープンソースのPythonライブラリである。
本稿では,現在MusPyが支援している11のデータセットの統計的解析について述べる。
論文 参考訳(メタデータ) (2020-08-05T06:16:13Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。