論文の概要: Learning from Limited Labels: Transductive Graph Label Propagation for Indian Music Analysis
- arxiv url: http://arxiv.org/abs/2601.03626v1
- Date: Wed, 07 Jan 2026 06:12:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 02:15:23.292058
- Title: Learning from Limited Labels: Transductive Graph Label Propagation for Indian Music Analysis
- Title(参考訳): 限定ラベルからの学習:インド音楽分析のためのトランスダクティブグラフラベルの伝播
- Authors: Parampreet Singh, Akshay Raina, Sayeedul Islam Sheikh, Vipul Arora,
- Abstract要約: ラベル伝搬 (LP) はグラフに基づく半教師あり学習手法であり、ラベルなし集合を教師なしで自動的にラベル付けする。
インド芸術音楽の2つの課題:ラガ識別と楽器分類にLPを適用した。
実験の結果,LPはラベル付けのオーバーヘッドを大幅に減らし,高品質なアノテーションを生成することがわかった。
- 参考スコア(独自算出の注目度): 8.1587811988485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Supervised machine learning frameworks rely on extensive labeled datasets for robust performance on real-world tasks. However, there is a lack of large annotated datasets in audio and music domains, as annotating such recordings is resource-intensive, laborious, and often require expert domain knowledge. In this work, we explore the use of label propagation (LP), a graph-based semi-supervised learning technique, for automatically labeling the unlabeled set in an unsupervised manner. By constructing a similarity graph over audio embeddings, we propagate limited label information from a small annotated subset to a larger unlabeled corpus in a transductive, semi-supervised setting. We apply this method to two tasks in Indian Art Music (IAM): Raga identification and Instrument classification. For both these tasks, we integrate multiple public datasets along with additional recordings we acquire from Prasar Bharati Archives to perform LP. Our experiments demonstrate that LP significantly reduces labeling overhead and produces higher-quality annotations compared to conventional baseline methods, including those based on pretrained inductive models. These results highlight the potential of graph-based semi-supervised learning to democratize data annotation and accelerate progress in music information retrieval.
- Abstract(参考訳): 監視された機械学習フレームワークは、現実世界のタスクで堅牢なパフォーマンスを実現するために、広範なラベル付きデータセットに依存している。
しかし、音声や音楽の領域には大量のアノテートデータセットがないため、このようなアノテートはリソース集約的で、精力的で、専門家のドメイン知識を必要とすることが多い。
本研究では、グラフに基づく半教師付き学習技術であるラベル伝搬(LP)を用いて、ラベルなし集合を教師なしで自動的にラベル付けする方法について検討する。
オーディオ埋め込み上に類似性グラフを構築することにより、小さな注釈付きサブセットから大きなラベル付きコーパスに限定ラベル情報を半教師付き半教師付きで伝達する。
本手法をインド芸術音楽(IAM)における2つの課題に応用する。
これら両方のタスクに対して、複数のパブリックデータセットと、Prasar Bharati Archivesから取得した追加記録を統合して、LPを実行する。
実験により,LPは事前学習した帰納モデルを含む従来のベースライン手法と比較して,ラベルのオーバーヘッドを著しく低減し,高品質なアノテーションを生成することが示された。
これらの結果は、データアノテーションを民主化し、音楽情報検索の進歩を加速させるグラフベースの半教師付き学習の可能性を強調している。
関連論文リスト
- Pseudo-labelling meets Label Smoothing for Noisy Partial Label Learning [8.387189407144403]
我々は、完全注釈付きデータセットのキュレーションが高価である問題に対する効果的な学習パラダイムとして、弱い教師付き学習を動機付けている。
PLL(Partial Learning)は、各トレーニングインスタンスが候補ラベルのセットとペアリングされる、弱い教師付き学習パラダイムである。
本稿では,近傍の重み付けアルゴリズムを用いて,まず画像に擬似ラベルを割り当てるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-07T13:32:47Z) - Perceptual Musical Features for Interpretable Audio Tagging [2.1730712607705485]
本研究では,音楽の自動タグ付けにおける解釈可能性の関連性について検討する。
3つの異なる情報抽出手法を組み込んだワークフローを構築した。
MTG-JamendoデータセットとGTZANデータセットの2つのデータセットについて実験を行った。
論文 参考訳(メタデータ) (2023-12-18T14:31:58Z) - Learning Instructions with Unlabeled Data for Zero-Shot Cross-Task
Generalization [68.91386402390403]
本研究では,学習中の命令をよりよく活用するために,Unlabeled Data Augmented Instruction Tuning (UDIT)を提案する。
タスクやデータセットのさまざまなシナリオにおいて,UDITの有効性を示すための広範な実験を行う。
論文 参考訳(メタデータ) (2022-10-17T15:25:24Z) - TagRuler: Interactive Tool for Span-Level Data Programming by
Demonstration [1.4050836886292872]
データプログラミングは、プログラミングの方法を知っているユーザーにのみアクセス可能だった。
我々はTagRulerという新しいツールを構築し、アノテータがプログラミングなしでスパンレベルのラベリング関数を簡単に構築できるようにする。
論文 参考訳(メタデータ) (2021-06-24T04:49:42Z) - Streaming Self-Training via Domain-Agnostic Unlabeled Images [62.57647373581592]
視覚認識モデル学習の過程を民主化することを目的としたストリーミング自己学習(SST)を提案する。
SSTの鍵となるのは、(1)ドメインに依存しない未ラベル画像により、追加の知識や監督なしにいくつかのラベル付き例でより良いモデルを学ぶことができ、(2)学習は継続的なプロセスであり、学習更新のスケジュールを構築することで行うことができる。
論文 参考訳(メタデータ) (2021-04-07T17:58:39Z) - Attention-Aware Noisy Label Learning for Image Classification [97.26664962498887]
大規模ラベル付きサンプルで学習した深層畳み込みニューラルネットワーク(CNN)は、コンピュータビジョンにおいて顕著な進歩を遂げている。
大量のラベル付きビジュアルデータを取得する最も安価な方法は、Flickrのようなユーザーが提供するラベルでウェブサイトからクロールすることである。
本稿では,潜在的なラベルノイズのあるデータセットに基づいて学習したネットワークの識別能力を向上させるために,注目に敏感なラベル学習手法を提案する。
論文 参考訳(メタデータ) (2020-09-30T15:45:36Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Labelling unlabelled videos from scratch with multi-modal
self-supervision [82.60652426371936]
ビデオデータセットの教師なしラベリングは、強力な機能エンコーダから解放されない。
人間のアノテーションを使わずにビデオデータセットの擬似ラベリングを可能にする新しいクラスタリング手法を提案する。
広範囲な分析により、結果として得られたクラスタは、真理の人間ラベルと高いセマンティックオーバーラップがあることが示されている。
論文 参考訳(メタデータ) (2020-06-24T12:28:17Z) - Naive-Student: Leveraging Semi-Supervised Learning in Video Sequences
for Urban Scene Segmentation [57.68890534164427]
本研究では,未ラベル映像シーケンスと追加画像の半教師付き学習を利用して,都市景観セグメンテーションの性能を向上させることができるかどうかを問う。
我々は単にラベルのないデータに対して擬似ラベルを予測し、人間の注釈付きデータと擬似ラベル付きデータの両方でその後のモデルを訓練する。
我々のNaive-Studentモデルは、このような単純で効果的な反復的半教師付き学習で訓練され、3つのCityscapesベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-05-20T18:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。