論文の概要: A Dataset for the Recognition of Historical and Handwritten Music Scores in Western Notation
- arxiv url: http://arxiv.org/abs/2605.18436v1
- Date: Mon, 18 May 2026 14:07:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:49.703557
- Title: A Dataset for the Recognition of Historical and Handwritten Music Scores in Western Notation
- Title(参考訳): 西洋表記における歴史的・手書き楽譜認識のためのデータセット
- Authors: Pau Torras, Jiří Mayer, Carles Badal, Martina Dvořáková, Markéta Herzanová Vlková, Gerard Asbert, Vojtěch Dvořák, Samuel Šomorjai, Jan Hajič, Alicia Fornés,
- Abstract要約: MusiCorpusは、これまでで最大の手書き楽曲のデータセットである。
エンドツーエンドおよびオブジェクト検出に基づく光音楽認識システムの訓練と評価に適している。
- 参考スコア(独自算出の注目度): 2.3800349692393814
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A large amount of musical heritage has been digitised by memory institutions: libraries, museums, and archives. Nevertheless, the field of Optical Music Recognition (OMR) has struggled with making this music machine-readable, despite advances in deep learning, mostly because no datasets for training systems in realistic conditions were available. The MusiCorpus dataset aims to remedy this situation by providing 1,309 pages of historical sheet music, primarily handwritten, with MusicXML transcriptions and symbol annotations. It is the largest dataset of handwritten music to date and the first dataset containing a realistic and representative sample of musical document collections from memory institutions, suitable for training and evaluating both end-to-end and object detection-based OMR systems and comparing their performance.
- Abstract(参考訳): 膨大な量の音楽遺産が、図書館、博物館、アーカイブなどの記憶機関によってデジタル化されている。
それでも、光学音楽認識(OMR)の分野は、ディープラーニングの進歩にもかかわらず、この音楽を機械で読めるものにすることに苦戦している。
MusiCorpusデータセットは、1,309ページの歴史的な楽譜を主に手書きで提供し、MusicXMLの書き起こしとシンボルアノテーションを提供することによって、この状況を改善することを目的としている。
これは、これまでで最大の手書き楽曲データセットであり、メモリ機関の文書コレクションの現実的で代表的なサンプルを含む最初のデータセットであり、エンドツーエンドとオブジェクト検出に基づくOMRシステムのトレーニングと評価に適しており、その性能の比較に適している。
関連論文リスト
- NOTA: Multimodal Music Notation Understanding for Visual Large Language Model [38.26693446133213]
大規模な総合マルチモーダル音楽表記データセットであるNOTAを提案する。
世界の3つの地域からの1,019,237のレコードで構成され、3つのタスクを含んでいる。
このデータセットに基づいて,音楽表記の視覚的大言語モデルであるNotaGPTを訓練した。
論文 参考訳(メタデータ) (2025-02-17T16:39:19Z) - Toward a More Complete OMR Solution [49.74172035862698]
光音楽認識は、音楽の表記をデジタル形式に変換することを目的としている。
OMRに取り組む1つのアプローチは、画像内の視覚音楽の表記要素を最初に検出するマルチステージパイプラインである。
YOLOv8に基づく音楽オブジェクト検出器を導入し,検出性能を向上する。
第2に、検出出力に基づいて記法組立段階を完了する教師付きトレーニングパイプラインを導入する。
論文 参考訳(メタデータ) (2024-08-31T01:09:12Z) - Optical Music Recognition in Manuscripts from the Ricordi Archive [6.274767633959002]
リコルディのアーカイブは、ドニゼッティ、ヴェルディ、プッチーニといった著名なオペラ作曲家の著名な音楽写本のコレクションであり、デジタル化されている。
我々は,ノート,ステーブ,クリーフ,消去,作曲家の注釈など,写本に描かれた様々な音楽要素を表すサンプルを自動的に抽出した。
我々は、識別された音楽要素を区別するために、複数のニューラルネットワークベースの分類器を訓練した。
論文 参考訳(メタデータ) (2024-08-14T09:29:11Z) - The Song Describer Dataset: a Corpus of Audio Captions for
Music-and-Language Evaluation [18.984512029792235]
高品質オーディオ・キャプション・ペアのクラウドソーシング・コーパスであるSong Describer dataset (SDD)を紹介した。
データセットは、706曲の録音を人間の記述で記述した1.1kの自然言語で構成されている。
論文 参考訳(メタデータ) (2023-11-16T17:52:21Z) - MARBLE: Music Audio Representation Benchmark for Universal Evaluation [79.25065218663458]
我々は,UniversaL Evaluation(MARBLE)のための音楽音響表現ベンチマークを紹介する。
音響、パフォーマンス、スコア、ハイレベルな記述を含む4つの階層レベルを持つ包括的分類を定義することで、様々な音楽情報検索(MIR)タスクのベンチマークを提供することを目的としている。
次に、8つの公開データセット上の14のタスクに基づいて統一されたプロトコルを構築し、ベースラインとして音楽録音で開発されたすべてのオープンソース事前学習モデルの表現を公平かつ標準的に評価する。
論文 参考訳(メタデータ) (2023-06-18T12:56:46Z) - A Dataset for Greek Traditional and Folk Music: Lyra [69.07390994897443]
本稿では,80時間程度で要約された1570曲を含むギリシャの伝統音楽と民俗音楽のデータセットについて述べる。
このデータセットにはYouTubeのタイムスタンプ付きリンクが組み込まれており、オーディオやビデオの検索や、インスツルメンテーション、地理、ジャンルに関する豊富なメタデータ情報が含まれている。
論文 参考訳(メタデータ) (2022-11-21T14:15:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。