論文の概要: From Weak to Strong Sound Event Labels using Adaptive Change-Point
Detection and Active Learning
- arxiv url: http://arxiv.org/abs/2403.08525v1
- Date: Wed, 13 Mar 2024 13:33:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 14:10:58.622557
- Title: From Weak to Strong Sound Event Labels using Adaptive Change-Point
Detection and Active Learning
- Title(参考訳): 適応的変化点を用いた弱音から強音まで
検出とアクティブラーニング
- Authors: John Martinsson, Olof Mogren, Maria Sandsten, Tuomas Virtanen
- Abstract要約: 適応的変化点検出(A-CPD)に基づく音声録音セグメンテーション手法を提案する。
ラベルのない音声記録毎に,アノテーションを導くために使用する確率曲線の導出に予測モデルを用いる。
アノテーションの予算が限られている場合でも,高品質なラベルを導き出すことが可能であることを示す。
- 参考スコア(独自算出の注目度): 12.136157718896515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work we propose an audio recording segmentation method based on an
adaptive change point detection (A-CPD) for machine guided weak label
annotation of audio recording segments. The goal is to maximize the amount of
information gained about the temporal activation's of the target sounds. For
each unlabeled audio recording, we use a prediction model to derive a
probability curve used to guide annotation. The prediction model is initially
pre-trained on available annotated sound event data with classes that are
disjoint from the classes in the unlabeled dataset. The prediction model then
gradually adapts to the annotations provided by the annotator in an active
learning loop. The queries used to guide the weak label annotator towards
strong labels are derived using change point detection on these probabilities.
We show that it is possible to derive strong labels of high quality even with a
limited annotation budget, and show favorable results for A-CPD when compared
to two baseline query strategies.
- Abstract(参考訳): 本研究では,アダプティブ・チェンジポイント検出(A-CPD)に基づく音声録音セグメンテーション手法を提案する。
目標は、目標音の時間的アクティベーションについて得られる情報を最大化することである。
ラベルのない音声記録毎に,アノテーションを導くために使用する確率曲線の導出に予測モデルを用いる。
予測モデルは、まず、利用可能な注釈付き音声イベントデータに基づいて、ラベルなしデータセットのクラスから切り離されたクラスで事前訓練される。
予測モデルは、アクティブな学習ループにおけるアノテーションによって提供されるアノテーションに徐々に適応する。
これらの確率の変化点検出を用いて、弱いラベルアノテータを強いラベルに導くために使用するクエリを導出する。
アノテーション予算が限られていても,高品質なラベルを導出できることを示すとともに,2つのベースラインクエリ戦略と比較して,A-CPDに有利な結果が得られることを示す。
関連論文リスト
- Co-training for Low Resource Scientific Natural Language Inference [65.37685198688538]
遠隔教師付きラベルに分類器のトレーニング力学に基づいて重みを割り当てる新しいコトレーニング手法を提案する。
予測された信頼度に対する任意のしきい値に基づいてサンプルをフィルタリングするのではなく、重要重みを割り当てることにより、自動ラベル付きデータの使用を最大化する。
提案手法は、遠隔監視ベースラインに対するマクロF1の1.5%の改善と、他の強力なSSLベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-06-20T18:35:47Z) - Extracting Clean and Balanced Subset for Noisy Long-tailed Classification [66.47809135771698]
そこで我々は,分布マッチングの観点から,クラスプロトタイプを用いた新しい擬似ラベリング手法を開発した。
手動で特定の確率尺度を設定することで、ノイズと長い尾を持つデータの副作用を同時に減らすことができる。
本手法は, クリーンなラベル付きクラスバランスサブセットを抽出し, ラベルノイズ付きロングテール分類において, 効果的な性能向上を実現する。
論文 参考訳(メタデータ) (2024-04-10T07:34:37Z) - Prefer to Classify: Improving Text Classifiers via Auxiliary Preference
Learning [76.43827771613127]
本稿では、このような補助データアノテーションの新しい代替手段として、入力テキストのペア間のタスク固有の嗜好について検討する。
本稿では、与えられた分類課題と補助的選好の両方を学ぶことの協調効果を享受できる、P2Cと呼ばれる新しいマルチタスク学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T04:04:47Z) - Learning to Detect Noisy Labels Using Model-Based Features [16.681748918518075]
Select-Enhanced Noisy label Training (SENT)を提案する。
SENTは、データ駆動の柔軟性を保ちながら、メタ学習に依存しない。
自己学習とラベルの破損の設定の下で、強力なベースラインよりもパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2022-12-28T10:12:13Z) - AdaWAC: Adaptively Weighted Augmentation Consistency Regularization for
Volumetric Medical Image Segmentation [3.609538870261841]
本稿では,容積医用画像分割のための適応重み付けアルゴリズムを提案する。
AdaWACは、ラベルセンスサンプルを教師付きクロスエントロピー損失とラベルスパースサンプルを整合正則化に割り当てる。
我々は,AdaWACがセグメンテーション性能とサンプル効率を向上させるだけでなく,ラベルのサブポピュレーションシフトに対するロバスト性を向上させることを実証的に実証した。
論文 参考訳(メタデータ) (2022-10-04T20:28:38Z) - Active Pointly-Supervised Instance Segmentation [106.38955769817747]
アクティブポイント制御型インスタンスセグメンテーション(APIS)という,経済的なアクティブな学習環境を提案する。
APISはボックスレベルのアノテーションから始まり、ボックス内のポイントを反復的にサンプリングし、オブジェクトに落ちているかどうかを問う。
これらの戦略で開発されたモデルは、挑戦的なMS-COCOデータセットに対して一貫したパフォーマンス向上をもたらす。
論文 参考訳(メタデータ) (2022-07-23T11:25:24Z) - Learning to Rectify for Robust Learning with Noisy Labels [25.149277009932423]
分類ネットワークのトレーニング手順を適応的に修正するためのワープ確率推論(WarPI)を提案する。
雑音ラベルによる頑健な学習の4つのベンチマークでWarPIを評価し, 異種雑音下での新たな最先端の学習を実現する。
論文 参考訳(メタデータ) (2021-11-08T02:25:50Z) - Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。
プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。
我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文 参考訳(メタデータ) (2021-10-22T01:55:01Z) - Towards Robustness to Label Noise in Text Classification via Noise
Modeling [7.863638253070439]
NLPの大規模なデータセットは、誤った自動および人間のアノテーション手順のために、ノイズの多いラベルに悩まされる。
本稿では,ラベルノイズを用いたテキスト分類の問題について検討し,分類器上での補助雑音モデルを用いてこのノイズを捉えることを目的とする。
論文 参考訳(メタデータ) (2021-01-27T05:41:57Z) - Meta Transition Adaptation for Robust Deep Learning with Noisy Labels [61.8970957519509]
本研究では,新しいメタ遷移学習戦略を提案する。
具体的には、クリーンなラベル付きメタデータの小さなセットのサウンドガイダンスにより、ノイズ遷移行列と分類器パラメータを相互に改善することができる。
本手法は, 従来技術よりも頑健な性能で, 遷移行列をより正確に抽出することができる。
論文 参考訳(メタデータ) (2020-06-10T07:27:25Z) - Active Learning for Sound Event Detection [18.750572243562576]
本稿では,音事象検出(SED)のための能動的学習システムを提案する。
本研究の目的は,学習したSEDモデルの精度を限定的なアノテーションで最大化することである。
注目すべきは、ターゲット音イベントが稀なデータセットにおいて、必要なアノテーションの労力を大幅に削減できることだ。
論文 参考訳(メタデータ) (2020-02-12T14:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。