論文の概要: Adaptive Few-Shot Learning Algorithm for Rare Sound Event Detection
- arxiv url: http://arxiv.org/abs/2205.11738v2
- Date: Thu, 26 May 2022 07:10:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-29 05:20:23.783175
- Title: Adaptive Few-Shot Learning Algorithm for Rare Sound Event Detection
- Title(参考訳): 希少音イベント検出のための適応的少数ショット学習アルゴリズム
- Authors: Chendong Zhao, Jianzong Wang, Leilai Li, Xiaoyang Qu, Jing Xiao
- Abstract要約: そこで本研究では,メトリックベースの数ショット学習フレームワークに容易に組み込むことができる新しいタスク適応型モジュールを提案する。
我々のモジュールはベースライン法よりも2つのデータセットの性能をかなり改善します。
- 参考スコア(独自算出の注目度): 24.385226516231004
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sound event detection is to infer the event by understanding the surrounding
environmental sounds. Due to the scarcity of rare sound events, it becomes
challenging for the well-trained detectors which have learned too much prior
knowledge. Meanwhile, few-shot learning methods promise a good generalization
ability when facing a new limited-data task. Recent approaches have achieved
promising results in this field. However, these approaches treat each support
example independently, ignoring the information of other examples from the
whole task. Because of this, most of previous methods are constrained to
generate a same feature embedding for all test-time tasks, which is not
adaptive to each inputted data. In this work, we propose a novel task-adaptive
module which is easy to plant into any metric-based few-shot learning
frameworks. The module could identify the task-relevant feature dimension.
Incorporating our module improves the performance considerably on two datasets
over baseline methods, especially for the transductive propagation network.
Such as +6.8% for 5-way 1-shot accuracy on ESC-50, and +5.9% on noiseESC-50. We
investigate our approach in the domain-mismatch setting and also achieve better
results than previous methods.
- Abstract(参考訳): 音の事象検出は、周囲の環境音を理解することによって事象を推測することである。
希少な音響事象が少なかったため、事前知識を過度に習得したよく訓練された検出器には困難が伴う。
一方、少数ショット学習法は、新しい限定データタスクに直面する際に、優れた一般化能力を約束する。
近年のアプローチはこの分野で有望な成果を上げている。
しかし、これらのアプローチは各サポートの例を独立に扱い、タスク全体から他の例の情報を無視している。
このため、従来の手法のほとんどは、入力された各データに適応しない全てのテスト時間タスクに同じ機能を埋め込むように制約されている。
そこで本研究では,メトリックベースの数ショット学習フレームワークに容易に組み込むことができる新しいタスク適応モジュールを提案する。
モジュールはタスク関連の特徴次元を識別できる。
モジュールを組み込むことで,ベースライン法,特にトランスダクティブ伝搬ネットワークにおける2つのデータセットのパフォーマンスが大幅に向上する。
例えば、ESC-50では5ウェイ1ショット精度+6.8%、ノイズESC-50では+5.9%である。
ドメインミスマッチ設定におけるアプローチを調査し,従来の手法よりも優れた結果を得る。
関連論文リスト
- Adaptive Rentention & Correction for Continual Learning [114.5656325514408]
連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。
アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。
ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-05-23T08:43:09Z) - Pretraining Representations for Bioacoustic Few-shot Detection using
Supervised Contrastive Learning [10.395255631261458]
バイオ音響応用において、ほとんどのタスクにはラベル付きトレーニングデータはほとんど含まれない。
教師付きコントラスト学習フレームワークを用いてデータ拡張を活用することにより、スクラッチからリッチな特徴抽出器を学習することができることを示す。
我々は検証セットで63.46%、テストセットで42.7%のFスコアを取得し、DCASEチャレンジで2位となった。
論文 参考訳(メタデータ) (2023-09-02T09:38:55Z) - Segment-level Metric Learning for Few-shot Bioacoustic Event Detection [56.59107110017436]
本稿では,モデル最適化時の肯定的事象と否定的事象の両方を利用するセグメントレベルの数ショット学習フレームワークを提案する。
本システムでは,DCASE2022チャレンジタスク5(DCASE2022-T5)のF値62.73の検証を行い,ベースラインプロトタイプネットワーク34.02の性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2022-07-15T22:41:30Z) - MetaKernel: Learning Variational Random Features with Limited Labels [120.90737681252594]
少数の注釈付きサンプルから学習し、新しいタスクでうまく一般化できるという根本的かつ困難な問題に、少数のショットラーニングが対処します。
マルチショット学習のためのランダムなフーリエ機能を備えたメタラーニングカーネルをMeta Kernelと呼びます。
論文 参考訳(メタデータ) (2021-05-08T21:24:09Z) - TSDAE: Using Transformer-based Sequential Denoising Auto-Encoder for
Unsupervised Sentence Embedding Learning [53.32740707197856]
TSDAE(Sequential Denoising Auto-Encoder)を用いた最新の非監視方式を提案する。
ドメイン内の監視されたアプローチのパフォーマンスの93.1%を達成することができる。
論文 参考訳(メタデータ) (2021-04-14T17:02:18Z) - Rectification-based Knowledge Retention for Continual Learning [49.1447478254131]
ディープラーニングモデルは、インクリメンタルな学習環境で訓練されたときに壊滅的な忘れに苦しむ。
タスクインクリメンタル学習問題に対処するための新しいアプローチを提案する。これは、インクリメンタルに到着する新しいタスクに関するモデルをトレーニングすることを含む。
私たちのアプローチは、ゼロショットと非ゼロショットタスクインクリメンタルラーニング設定の両方で使用できます。
論文 参考訳(メタデータ) (2021-03-30T18:11:30Z) - Environmental sound analysis with mixup based multitask learning and
cross-task fusion [0.12891210250935145]
音響シーン分類と音響イベント分類は 密接に関連している2つの課題です
本書では,上記の課題に対して二段階法を提案する。
提案手法は,音響シーンと音響イベント分類の相補的特徴を確認した。
論文 参考訳(メタデータ) (2021-03-30T05:11:53Z) - iTAML: An Incremental Task-Agnostic Meta-learning Approach [123.10294801296926]
人間は経験が成長するにつれて、新しい知識を継続的に学ぶことができる。
ディープニューラルネットワークにおける以前の学習は、新しいタスクでトレーニングされたときにすぐに消えてしまう可能性がある。
遭遇した全てのタスク間の平衡を維持するために,新しいメタラーニング手法を導入する。
論文 参考訳(メタデータ) (2020-03-25T21:42:48Z) - Active Learning for Sound Event Detection [18.750572243562576]
本稿では,音事象検出(SED)のための能動的学習システムを提案する。
本研究の目的は,学習したSEDモデルの精度を限定的なアノテーションで最大化することである。
注目すべきは、ターゲット音イベントが稀なデータセットにおいて、必要なアノテーションの労力を大幅に削減できることだ。
論文 参考訳(メタデータ) (2020-02-12T14:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。