論文の概要: Experimenting active and sequential learning in a medieval music manuscript
- arxiv url: http://arxiv.org/abs/2507.15633v1
- Date: Mon, 21 Jul 2025 13:55:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.426688
- Title: Experimenting active and sequential learning in a medieval music manuscript
- Title(参考訳): 中世音楽写本におけるアクティブ・シーケンシャル学習の試み
- Authors: Sachin Sharma, Federico Simonetta, Michele Flammini,
- Abstract要約: 本稿では,中世音楽写本のオブジェクト検出とレイアウト認識に適したアクティブラーニング(AL)とシークエンシャルラーニング(SL)の予備研究について述べる。
本システムでは,反復的なラベル付けと再トレーニングを行う上で,最も不確実性が高い(最も低い予測信頼度)サンプルを選択する。
原稿では不確実性に基づくALは有効ではなく,データ共有シナリオにおいてより有用な手法を提唱している。
- 参考スコア(独自算出の注目度): 7.790089838318836
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Optical Music Recognition (OMR) is a cornerstone of music digitization initiatives in cultural heritage, yet it remains limited by the scarcity of annotated data and the complexity of historical manuscripts. In this paper, we present a preliminary study of Active Learning (AL) and Sequential Learning (SL) tailored for object detection and layout recognition in an old medieval music manuscript. Leveraging YOLOv8, our system selects samples with the highest uncertainty (lowest prediction confidence) for iterative labeling and retraining. Our approach starts with a single annotated image and successfully boosts performance while minimizing manual labeling. Experimental results indicate that comparable accuracy to fully supervised training can be achieved with significantly fewer labeled examples. We test the methodology as a preliminary investigation on a novel dataset offered to the community by the Anonymous project, which studies laude, a poetical-musical genre spread across Italy during the 12th-16th Century. We show that in the manuscript at-hand, uncertainty-based AL is not effective and advocates for more usable methods in data-scarcity scenarios.
- Abstract(参考訳): 光音楽認識(OMR)は、文化的遺産における音楽デジタル化の取り組みの基盤であるが、注釈付きデータの不足と歴史的写本の複雑さによって制限されている。
本稿では,中世音楽写本のオブジェクト検出とレイアウト認識に適したアクティブラーニング(AL)とシークエンシャルラーニング(SL)の予備研究について述べる。
YOLOv8を活用することで、反復ラベル付けと再学習のための最も不確実性の高い(最も低い予測信頼度)サンプルを選択する。
提案手法は,1つの注釈付き画像から始まり,手動ラベリングを最小化しながら,性能の向上に成功している。
実験の結果、ラベル付きサンプルをはるかに少なくすることで、完全教師付きトレーニングに匹敵する精度が達成できることが示唆された。
我々は,この方法論を,12世紀から16世紀にかけてイタリア全土に広まった詩・音楽のジャンルであるヌードを研究するアノニマス・プロジェクト(Anonymous project)によって,コミュニティに提供された新しいデータセットに関する予備的な調査としてテストした。
原稿では,不確実性に基づくALは有効ではなく,データ共有シナリオにおいてより有用な手法を提唱している。
関連論文リスト
- NER4all or Context is All You Need: Using LLMs for low-effort, high-performance NER on historical texts. A humanities informed approach [0.03187482513047917]
我々は,NERの2つの主要なNLPフレームワークにおいて,手軽に利用できる,最先端のLCMが顕著に優れていることを示す。
提案手法は,NLPツールの確立に必要なスクリプティング言語や計算能力の障壁を取り除くことで,すべての歴史学者がNERにアクセスできるようにする。
論文 参考訳(メタデータ) (2025-02-04T16:54:23Z) - Low-Data Classification of Historical Music Manuscripts: A Few-Shot Learning Approach [0.0]
歴史的写本における記号分類のための自己指導型学習フレームワークを開発した。
この課題を克服するために、ニューラルネットワークによる特徴抽出器を非ラベルデータでトレーニングし、最小限のサンプルで効果的な分類を可能にする。
論文 参考訳(メタデータ) (2024-11-25T14:14:25Z) - LC-Protonets: Multi-Label Few-Shot Learning for World Music Audio Tagging [65.72891334156706]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文 参考訳(メタデータ) (2024-09-17T15:13:07Z) - Towards Explainable and Interpretable Musical Difficulty Estimation: A Parameter-efficient Approach [49.2787113554916]
音楽コレクションの整理には曲の難易度を推定することが重要である。
シンボリックな音楽表現の難易度推定には説明可能な記述子を用いる。
ピアノレパートリーで評価したアプローチは,平均2乗誤差(MSE)が1.7。
論文 参考訳(メタデータ) (2024-08-01T11:23:42Z) - Co-training for Low Resource Scientific Natural Language Inference [65.37685198688538]
遠隔教師付きラベルに分類器のトレーニング力学に基づいて重みを割り当てる新しいコトレーニング手法を提案する。
予測された信頼度に対する任意のしきい値に基づいてサンプルをフィルタリングするのではなく、重要重みを割り当てることにより、自動ラベル付きデータの使用を最大化する。
提案手法は、遠隔監視ベースラインに対するマクロF1の1.5%の改善と、他の強力なSSLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-06-20T18:35:47Z) - Self-supervised Pre-training of Text Recognizers [0.0]
マスク付きラベル予測に基づく自己教師付き事前学習手法について検討する。
我々は、歴史的手書き(ベンサム)と歴史的印刷データセットの実験を行う。
評価の結果,対象領域からのデータの自己教師付き事前学習は非常に効果的であるが,近縁領域からの移行学習よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-05-01T09:58:57Z) - VGTS: Visually Guided Text Spotting for Novel Categories in Historical Manuscripts [26.09365732823049]
本稿では,1つの注釈付きサポートサンプルを用いて,新しい文字を正確に検出するビジュアルガイドテキストスポッティング(VGTS)手法を提案する。
DSAブロックは、人間の視覚的スポッティングプロセスを模倣して、サポート画像とクエリ画像における識別的空間領域を特定し、焦点を合わせ、学習することを目的としている。
低リソーススポッティングタスクにおける例不均衡問題に対処するため,距離メトリック学習のための埋め込み空間の識別力を高める新しいトーラス損失関数を開発した。
論文 参考訳(メタデータ) (2023-04-03T06:40:52Z) - CSSL-MHTR: Continual Self-Supervised Learning for Scalable Multi-script Handwritten Text Recognition [16.987008461171065]
我々は,手書き文字認識における破滅的な忘れの問題を軽減するために,連続的な自己指導型学習の可能性を探究する。
提案手法は,各タスクにアダプタと呼ばれる中間層を追加し,現在のタスクを学習しながら,前モデルからの知識を効率的に抽出する。
私たちは英語、イタリア語、ロシア語のスクリプトで最先端のパフォーマンスを達成しましたが、タスクごとにいくつかのパラメータしか追加していません。
論文 参考訳(メタデータ) (2023-03-16T14:27:45Z) - PromptCAL: Contrastive Affinity Learning via Auxiliary Prompts for
Generalized Novel Category Discovery [39.03732147384566]
Generalized Novel Category Discovery (GNCD) 設定は、既知のクラスや新しいクラスから来るラベルなしのトレーニングデータを分類することを目的としている。
本稿では,この課題に対処するために,PromptCALと呼ばれる補助視覚プロンプトを用いたコントラスト親和性学習法を提案する。
提案手法は,クラストークンと視覚的プロンプトのための既知のクラスと新しいクラスのセマンティッククラスタリングを改善するために,信頼性の高いペアワイズサンプル親和性を発見する。
論文 参考訳(メタデータ) (2022-12-11T20:06:14Z) - Annotation Error Detection: Analyzing the Past and Present for a More
Coherent Future [63.99570204416711]
我々は、潜在的なアノテーションの誤りを検知するための18の手法を再実装し、9つの英語データセット上で評価する。
アノテーションエラー検出タスクの新しい形式化を含む一様評価設定を定義する。
私たちはデータセットと実装を,使いやすく,オープンソースのソフトウェアパッケージとしてリリースしています。
論文 参考訳(メタデータ) (2022-06-05T22:31:45Z) - Trash to Treasure: Harvesting OOD Data with Cross-Modal Matching for
Open-Set Semi-Supervised Learning [101.28281124670647]
オープンセット半教師付き学習(Open-set SSL)では、ラベルなしデータにOOD(Out-of-distribution)サンプルを含む、難しいが実用的なシナリオを調査する。
我々は、OODデータの存在を効果的に活用し、特徴学習を増強する新しいトレーニングメカニズムを提案する。
我々のアプローチは、オープンセットSSLのパフォーマンスを大幅に向上させ、最先端技術よりも大きなマージンで性能を向上します。
論文 参考訳(メタデータ) (2021-08-12T09:14:44Z) - Confident Coreset for Active Learning in Medical Image Analysis [57.436224561482966]
本稿では,情報的サンプルを効果的に選択するための,不確実性と分散性を考慮した新しい能動的学習手法である信頼コアセットを提案する。
2つの医用画像解析タスクの比較実験により,本手法が他の活動的学習方法より優れていることを示す。
論文 参考訳(メタデータ) (2020-04-05T13:46:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。