論文の概要: Aggregation Strategies for Efficient Annotation of Bioacoustic Sound Events Using Active Learning
- arxiv url: http://arxiv.org/abs/2503.02422v1
- Date: Tue, 04 Mar 2025 09:08:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:13:09.437868
- Title: Aggregation Strategies for Efficient Annotation of Bioacoustic Sound Events Using Active Learning
- Title(参考訳): 能動的学習を用いた生体音響イベントの効率的な注釈付けのための集約手法
- Authors: Richard Lindholm, Oscar Marklund, Olof Mogren, John Martinsson,
- Abstract要約: アクティブラーニング(AL)のための新しい不確実性集約戦略であるTop K Entropyを紹介する。
トップKエントロピーは、すべてのセグメントで不確実性を平均化するのではなく、オーディオ録音における最も不確実なセグメントを優先する。
より少ない音響イベントを持つデータセットにおいて、ラベルの少ない場合、同じモデル性能につながることが示される。
- 参考スコア(独自算出の注目度): 0.8678250057211367
- License:
- Abstract: The vast amounts of audio data collected in Sound Event Detection (SED) applications require efficient annotation strategies to enable supervised learning. Manual labeling is expensive and time-consuming, making Active Learning (AL) a promising approach for reducing annotation effort. We introduce Top K Entropy, a novel uncertainty aggregation strategy for AL that prioritizes the most uncertain segments within an audio recording, instead of averaging uncertainty across all segments. This approach enables the selection of entire recordings for annotation, improving efficiency in sparse data scenarios. We compare Top K Entropy to random sampling and Mean Entropy, and show that fewer labels can lead to the same model performance, particularly in datasets with sparse sound events. Evaluations are conducted on audio mixtures of sound recordings from parks with meerkat, dog, and baby crying sound events, representing real-world bioacoustic monitoring scenarios. Using Top K Entropy for active learning, we can achieve comparable performance to training on the fully labeled dataset with only 8% of the labels. Top K Entropy outperforms Mean Entropy, suggesting that it is best to let the most uncertain segments represent the uncertainty of an audio file. The findings highlight the potential of AL for scalable annotation in audio and time-series applications, including bioacoustics.
- Abstract(参考訳): Sound Event Detection (SED)アプリケーションで収集される大量のオーディオデータは、教師あり学習を可能にする効果的なアノテーション戦略を必要とする。
手動ラベリングは高価で時間を要するため、アクティブラーニング(AL)はアノテーションの労力を減らすための有望なアプローチである。
音声録音における最も不確実なセグメントを優先するALの新たな不確実性アグリゲーション戦略であるTop K Entropyを導入する。
このアプローチにより、アノテーションのためのレコード全体の選択が可能になり、スパースデータシナリオの効率が向上する。
我々は、Top K Entropyをランダムサンプリングと平均エントロピーと比較し、特に疎音イベントのデータセットにおいて、同じモデル性能につながるラベルが少ないことを示す。
実環境における生体音響モニタリングのシナリオを表現するため,公園内の録音音とメアカート,犬,乳児の泣き声のイベントの混合音について評価を行った。
アクティブな学習にTop K Entropyを使用すると、ラベルのわずか8%で完全にラベル付けされたデータセットのトレーニングに匹敵するパフォーマンスを達成できます。
Top K Entropyは平均エントロピーよりも優れており、最も不確実なセグメントがオーディオファイルの不確実性を表すのが最善であることを示している。
この結果は、バイオアコースティックスを含むオーディオおよび時系列アプリケーションにおけるスケーラブルなアノテーションに対するALの可能性を強調している。
関連論文リスト
- AEON: Adaptive Estimation of Instance-Dependent In-Distribution and Out-of-Distribution Label Noise for Robust Learning [17.397478141194778]
実世界のデータセットには、イン・ディストリビューション(ID)とアウト・オブ・ディストリビューション(OOD)のインスタンス依存ラベルノイズが混在することが多い。
本稿では,これらの研究ギャップに対処するために,インスタンス依存型In-DistributionとOut-of-Distribution Label Noise(AEON)の適応推定手法を提案する。
AEONは、インスタンス依存IDとOODラベルのノイズ率を動的に推定する効率的な1段階雑音ラベル学習手法である。
論文 参考訳(メタデータ) (2025-01-23T05:19:00Z) - Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - From Weak to Strong Sound Event Labels using Adaptive Change-Point Detection and Active Learning [11.312115846980602]
音声録音セグメントの弱いラベルアノテーションを機械誘導する適応的変化点検出法(A-CPD)を提案する。
ラベルのない音声記録毎に,アノテーションを導くために使用する確率曲線の導出に予測モデルを用いる。
アノテーション予算の制限により,高品質なラベルを抽出し,A-CPDに好適な結果を示すことができることを示す。
論文 参考訳(メタデータ) (2024-03-13T13:33:35Z) - Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio
Detection [54.20974251478516]
本稿では,破滅的な忘れを克服するために,偽音声検出のための連続学習アルゴリズムを提案する。
検出ネットワークを微調整する場合,本手法では,真の発話と偽発話の比率に応じて,重み付けの方向を適応的に計算する。
本手法は,音声の感情認識などの関連分野に容易に一般化できる。
論文 参考訳(メタデータ) (2023-08-07T05:05:49Z) - Towards Harnessing Feature Embedding for Robust Learning with Noisy
Labels [44.133307197696446]
ディープニューラルネットワーク(DNN)の記憶効果は,近年のラベルノイズ学習法において重要な役割を担っている。
ラベルノイズを用いたディープラーニングのための新しい特徴埋め込み方式, LabEl Noise Dilution (LEND) を提案する。
論文 参考訳(メタデータ) (2022-06-27T02:45:09Z) - Robust Meta-learning with Sampling Noise and Label Noise via
Eigen-Reptile [78.1212767880785]
Meta-learnerは、利用可能なサンプルがわずかしかないため、過度に適合する傾向がある。
ノイズの多いラベルでデータを扱う場合、メタラーナーはラベルノイズに対して非常に敏感になる可能性がある。
本稿では,タスク固有のパラメータの主要な方向でメタパラメータを更新するEigen-Reptile(ER)を提案する。
論文 参考訳(メタデータ) (2022-06-04T08:48:02Z) - UNICON: Combating Label Noise Through Uniform Selection and Contrastive
Learning [89.56465237941013]
UNICONは,高ラベル雑音に対して頑健な,シンプルで効果的なサンプル選択法である。
90%のノイズレートでCIFAR100データセットの最先端データよりも11.4%改善した。
論文 参考訳(メタデータ) (2022-03-28T07:36:36Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z) - Open-set Label Noise Can Improve Robustness Against Inherent Label Noise [27.885927200376386]
オープンセットノイズラベルは非毒性であり, 固有ノイズラベルに対するロバスト性にも寄与することを示した。
本研究では,動的雑音ラベル(ODNL)を用いたオープンセットサンプルをトレーニングに導入することで,シンプルかつ効果的な正規化を提案する。
論文 参考訳(メタデータ) (2021-06-21T07:15:50Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z) - Active Learning for Sound Event Detection [18.750572243562576]
本稿では,音事象検出(SED)のための能動的学習システムを提案する。
本研究の目的は,学習したSEDモデルの精度を限定的なアノテーションで最大化することである。
注目すべきは、ターゲット音イベントが稀なデータセットにおいて、必要なアノテーションの労力を大幅に削減できることだ。
論文 参考訳(メタデータ) (2020-02-12T14:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。