論文の概要: Low-Data Classification of Historical Music Manuscripts: A Few-Shot Learning Approach
- arxiv url: http://arxiv.org/abs/2411.16408v1
- Date: Mon, 25 Nov 2024 14:14:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:24:28.308108
- Title: Low-Data Classification of Historical Music Manuscripts: A Few-Shot Learning Approach
- Title(参考訳): 歴史的音楽写本の低データ分類 : 少数ショット学習アプローチ
- Authors: Elona Shatri, Daniel Raymond, George Fazekas,
- Abstract要約: 歴史的写本における記号分類のための自己指導型学習フレームワークを開発した。
この課題を克服するために、ニューラルネットワークによる特徴抽出器を非ラベルデータでトレーニングし、最小限のサンプルで効果的な分類を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In this paper, we explore the intersection of technology and cultural preservation by developing a self-supervised learning framework for the classification of musical symbols in historical manuscripts. Optical Music Recognition (OMR) plays a vital role in digitising and preserving musical heritage, but historical documents often lack the labelled data required by traditional methods. We overcome this challenge by training a neural-based feature extractor on unlabelled data, enabling effective classification with minimal samples. Key contributions include optimising crop preprocessing for a self-supervised Convolutional Neural Network and evaluating classification methods, including SVM, multilayer perceptrons, and prototypical networks. Our experiments yield an accuracy of 87.66\%, showcasing the potential of AI-driven methods to ensure the survival of historical music for future generations through advanced digital archiving techniques.
- Abstract(参考訳): 本稿では,歴史的写本における音楽記号の分類のための自己指導型学習フレームワークを開発することにより,技術と文化の交わりについて考察する。
光音楽認識(OMR)は、音楽遺産のデジタル化と保存において重要な役割を担っているが、歴史的文書には伝統的な方法が必要とするラベル付きデータがないことが多い。
この課題を克服するために、ニューラルネットワークによる特徴抽出器を非ラベルデータでトレーニングし、最小限のサンプルで効果的な分類を可能にする。
主な貢献は、自己教師型畳み込みニューラルネットワークのための作物前処理の最適化と、SVM、多層パーセプトロン、プロトタイプネットワークなどの分類方法の評価である。
我々の実験は87.66\%の精度を示し、先進的なデジタルアーカイビング技術により、後世の歴史的音楽の生存を確実にするためのAI駆動手法の可能性を示している。
関連論文リスト
- Learning based Ge'ez character handwritten recognition [7.699119649521884]
文化的・歴史的に重要な古代エチオピア文字であるゲエズは、筆跡認識研究においてほとんど無視されてきた。
畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ネットワークを用いた手書き文字認識システムを開発した。
まず、CNNが個々の文字の認識を訓練し、LSTMに基づく単語認識システムのための特徴抽出器として機能する。
論文 参考訳(メタデータ) (2024-11-20T14:22:15Z) - Improving Musical Instrument Classification with Advanced Machine Learning Techniques [0.0]
近年の機械学習、特にディープラーニングの進歩により、楽器を音声信号から識別し分類する能力が強化されている。
本研究では,Naive Bayes,Support Vector Machines,Random Forests,AdaBoostやXGBoostといったBootingテクニックなど,さまざまな機械学習手法を適用した。
これらの手法の有効性を,注釈付き音声の大規模リポジトリであるN Synthデータセットを用いて評価した。
論文 参考訳(メタデータ) (2024-11-01T00:13:46Z) - LC-Protonets: Multi-label Few-shot learning for world music audio tagging [65.72891334156706]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文 参考訳(メタデータ) (2024-09-17T15:13:07Z) - Hierarchical Augmentation and Distillation for Class Incremental Audio-Visual Video Recognition [62.85802939587308]
本稿では,CIAVVR(Class Incremental Audio-Visual Video Recognition)の探索に焦点をあてる。
記憶されたデータと過去のクラスの学習モデルの両方が歴史的知識を含んでいるため、過去のデータ知識と過去のモデル知識をキャプチャして破滅的な忘れを防げるかが課題である。
本稿では,階層拡張モジュール (HAM) と階層拡張モジュール (HDM) を組み合わせた階層拡張蒸留 (HAD) を導入し,データとモデルの階層構造を効率的に活用する。
論文 参考訳(メタデータ) (2024-01-11T23:00:24Z) - Self-Supervised Contrastive Learning for Robust Audio-Sheet Music
Retrieval Systems [3.997809845676912]
自己指導型コントラスト学習は、実際の音楽コンテンツからの注釈付きデータの不足を軽減することができることを示す。
クロスモーダルなピース識別の高レベルなタスクにスニペットを埋め込む。
本研究では,実際の音楽データが存在する場合,検索品質が30%から100%に向上することが観察された。
論文 参考訳(メタデータ) (2023-09-21T14:54:48Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - Partner-Assisted Learning for Few-Shot Image Classification [54.66864961784989]
人間の視覚能力を模倣し、徹底的な人間のアノテーションを必要とせずに効果的なモデルを学ぶために、わずかなショットラーニングが研究されている。
本稿では,新しいクラスのプロトタイプをラベル付きサンプルから推定できるように,要素表現を得るためのトレーニング戦略の設計に焦点をあてる。
本稿では,まずパートナーエンコーダのペアワイド類似性をモデル化し,ソフトアンカーとして機能する特徴を抽出し,その出力をソフトアンカーと整列させ,分類性能を最大化しようとする2段階トレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T22:46:19Z) - SCARF: Self-Supervised Contrastive Learning using Random Feature
Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。
SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-29T08:08:33Z) - Sequence Generation using Deep Recurrent Networks and Embeddings: A
study case in music [69.2737664640826]
本稿では,異なる種類の記憶機構(メモリセル)について評価し,音楽合成分野におけるその性能について検討する。
提案したアーキテクチャの性能を自動評価するために,定量的な測定値のセットが提示される。
論文 参考訳(メタデータ) (2020-12-02T14:19:19Z) - Detecting Generic Music Features with Single Layer Feedforward Network
using Unsupervised Hebbian Computation [3.8707695363745223]
著者らは、人気のあるオープンソース音楽コーパスから、そのような特徴に関する情報を抽出する。
彼らは同じデータセットを使用して、一層ニューラルネットワークに教師なしのヘビアン学習技術を適用する。
教師なしトレーニングアルゴリズムは、提案したニューラルネットワークを強化し、音楽特徴の検出を成功させるために90.36%の精度を達成する。
論文 参考訳(メタデータ) (2020-08-31T13:57:31Z) - From Artificial Neural Networks to Deep Learning for Music Generation --
History, Concepts and Trends [0.0]
本稿では,ディープラーニング技術に基づく音楽生成のチュートリアルを提供する。
1980年代後半から、音楽生成のための人工ニューラルネットワークを用いて、いくつかの初期の作品を分析している。
論文 参考訳(メタデータ) (2020-04-07T00:33:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。