論文の概要: Segment-level Metric Learning for Few-shot Bioacoustic Event Detection
- arxiv url: http://arxiv.org/abs/2207.07773v1
- Date: Fri, 15 Jul 2022 22:41:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-20 07:44:35.242340
- Title: Segment-level Metric Learning for Few-shot Bioacoustic Event Detection
- Title(参考訳): バイオ音響イベント検出のためのセグメントレベルメトリック学習
- Authors: Haohe Liu, Xubo Liu, Xinhao Mei, Qiuqiang Kong, Wenwu Wang, Mark D.
Plumbley
- Abstract要約: 本稿では,モデル最適化時の肯定的事象と否定的事象の両方を利用するセグメントレベルの数ショット学習フレームワークを提案する。
本システムでは,DCASE2022チャレンジタスク5(DCASE2022-T5)のF値62.73の検証を行い,ベースラインプロトタイプネットワーク34.02の性能を大きなマージンで向上させる。
- 参考スコア(独自算出の注目度): 56.59107110017436
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot bioacoustic event detection is a task that detects the occurrence
time of a novel sound given a few examples. Previous methods employ metric
learning to build a latent space with the labeled part of different sound
classes, also known as positive events. In this study, we propose a
segment-level few-shot learning framework that utilizes both the positive and
negative events during model optimization. Training with negative events, which
are larger in volume than positive events, can increase the generalization
ability of the model. In addition, we use transductive inference on the
validation set during training for better adaptation to novel classes. We
conduct ablation studies on our proposed method with different setups on input
features, training data, and hyper-parameters. Our final system achieves an
F-measure of 62.73 on the DCASE 2022 challenge task 5 (DCASE2022-T5) validation
set, outperforming the performance of the baseline prototypical network 34.02
by a large margin. Using the proposed method, our submitted system ranks 2nd in
DCASE2022-T5. The code of this paper is fully open-sourced at
https://github.com/haoheliu/DCASE_2022_Task_5.
- Abstract(参考訳): 少数ショットのバイオ音響イベント検出は、いくつか例を挙げると、新しい音の発生時間を検出するタスクである。
従来の手法では、様々な音響クラスのラベル付き部分を持つ潜在空間を構築するためにメートル法学習を用いていた。
本研究では,モデル最適化中に正のイベントと負のイベントの両方を利用する,セグメントレベルの少数ショット学習フレームワークを提案する。
正の事象よりも体積が大きい負の事象を持つトレーニングは、モデルの一般化能力を高めることができる。
さらに,学習中の検証セットにトランスダクティブ推論を用い,新しいクラスへの適応性を向上する。
我々は,入力特徴,トレーニングデータ,ハイパーパラメータの異なる設定で,提案手法のアブレーション研究を行う。
最終システムはDCASE2022チャレンジタスク5(DCASE2022-T5)検証セット上で62.73のF測定を行い、ベースラインプロトタイプネットワーク34.02の性能を大きなマージンで上回った。
提案手法を用いて,提案方式はDCASE2022-T5で2位となった。
本論文のコードはhttps://github.com/haoheliu/DCASE_2022_Task_5で完全にオープンソース化されている。
関連論文リスト
- Adaptive Rentention & Correction for Continual Learning [114.5656325514408]
連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。
アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。
ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-05-23T08:43:09Z) - Understanding and Mitigating the Label Noise in Pre-training on
Downstream Tasks [91.15120211190519]
本稿では、事前学習データセットにおけるノイズの性質を理解し、下流タスクへの影響を軽減することを目的とする。
雑音の悪影響を軽減するために特徴空間に適応する軽量ブラックボックスチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2023-09-29T06:18:15Z) - Pretraining Representations for Bioacoustic Few-shot Detection using
Supervised Contrastive Learning [10.395255631261458]
バイオ音響応用において、ほとんどのタスクにはラベル付きトレーニングデータはほとんど含まれない。
教師付きコントラスト学習フレームワークを用いてデータ拡張を活用することにより、スクラッチからリッチな特徴抽出器を学習することができることを示す。
我々は検証セットで63.46%、テストセットで42.7%のFスコアを取得し、DCASEチャレンジで2位となった。
論文 参考訳(メタデータ) (2023-09-02T09:38:55Z) - DiffSED: Sound Event Detection with Denoising Diffusion [70.18051526555512]
生成学習の観点からSED問題を再構築する。
具体的には,騒音拡散過程において,雑音のある提案から音の時間境界を生成することを目的としている。
トレーニング中は,ノイズの多い遅延クエリを基本バージョンに変換することで,ノイズ発生過程の逆転を学習する。
論文 参考訳(メタデータ) (2023-08-14T17:29:41Z) - Adaptive Few-Shot Learning Algorithm for Rare Sound Event Detection [24.385226516231004]
そこで本研究では,メトリックベースの数ショット学習フレームワークに容易に組み込むことができる新しいタスク適応型モジュールを提案する。
我々のモジュールはベースライン法よりも2つのデータセットの性能をかなり改善します。
論文 参考訳(メタデータ) (2022-05-24T03:13:12Z) - Environmental sound analysis with mixup based multitask learning and
cross-task fusion [0.12891210250935145]
音響シーン分類と音響イベント分類は 密接に関連している2つの課題です
本書では,上記の課題に対して二段階法を提案する。
提案手法は,音響シーンと音響イベント分類の相補的特徴を確認した。
論文 参考訳(メタデータ) (2021-03-30T05:11:53Z) - Extensively Matching for Few-shot Learning Event Detection [66.31312496170139]
超視覚的な学習設定下でのイベント検出モデルは、新しいイベントタイプへの転送に失敗する。
イベント検出では、あまり画像学習は行われていない。
sup-port の例にマッチする2つのノベルロス因子を提案し,モデルにより多くのトレーニング信号を与える。
論文 参考訳(メタデータ) (2020-06-17T18:30:30Z) - Exploiting the Matching Information in the Support Set for Few Shot
Event Classification [66.31312496170139]
数ショットの学習セットに基づくイベント分類について検討する。
本稿では,学習過程におけるサポートセットを効果的に活用する新たなトレーニング手法を提案する。
2つのベンチマークECデータセットを用いた実験の結果,提案手法は,イベント分類の精度を最大10%向上できることがわかった。
論文 参考訳(メタデータ) (2020-02-13T00:40:36Z) - Active Learning for Sound Event Detection [18.750572243562576]
本稿では,音事象検出(SED)のための能動的学習システムを提案する。
本研究の目的は,学習したSEDモデルの精度を限定的なアノテーションで最大化することである。
注目すべきは、ターゲット音イベントが稀なデータセットにおいて、必要なアノテーションの労力を大幅に削減できることだ。
論文 参考訳(メタデータ) (2020-02-12T14:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。