論文の概要: Few-shot acoustic event detection via meta-learning
- arxiv url: http://arxiv.org/abs/2002.09143v1
- Date: Fri, 21 Feb 2020 06:02:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 01:01:06.079422
- Title: Few-shot acoustic event detection via meta-learning
- Title(参考訳): メタラーニングによる音声イベント検出
- Authors: Bowen Shi, Ming Sun, Krishna C. Puvvada, Chieh-Chi Kao, Spyros
Matsoukas, Chao Wang
- Abstract要約: 本論文では,数発の音響イベント検出(AED)について検討する。
わずかながらの学習により、ラベル付きデータで新しいイベントを検出できる。
- 参考スコア(独自算出の注目度): 23.035377360550438
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study few-shot acoustic event detection (AED) in this paper. Few-shot
learning enables detection of new events with very limited labeled data.
Compared to other research areas like computer vision, few-shot learning for
audio recognition has been under-studied. We formulate few-shot AED problem and
explore different ways of utilizing traditional supervised methods for this
setting as well as a variety of meta-learning approaches, which are
conventionally used to solve few-shot classification problem. Compared to
supervised baselines, meta-learning models achieve superior performance, thus
showing its effectiveness on generalization to new audio events. Our analysis
including impact of initialization and domain discrepancy further validate the
advantage of meta-learning approaches in few-shot AED.
- Abstract(参考訳): 本論文では,数発の音響イベント検出(AED)について検討する。
わずかながらの学習により、ラベル付きデータで新しいイベントを検出できる。
コンピュータビジョンなどの他の研究分野と比較して、音声認識のための少数ショット学習は研究されていない。
提案手法は, 従来の教師付き手法と, 従来, 様々なメタラーニング手法を用いて, 少数ショットaed問題を定式化し, 異なる手法を探索する。
教師付きベースラインと比較すると,メタラーニングモデルは優れた性能を示し,新たな音声イベントへの一般化に有効であることを示す。
初期化の影響やドメインの不一致などの分析により,AEDにおけるメタラーニングアプローチの利点がさらに検証された。
関連論文リスト
- A contrastive-learning approach for auditory attention detection [11.28441753596964]
本稿では,参加音声信号の潜在表現と対応する脳波信号との差を最小化するために,自己教師付き学習に基づく手法を提案する。
この結果と以前に公表した手法を比較し,検証セット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-10-24T03:13:53Z) - Pretraining Representations for Bioacoustic Few-shot Detection using
Supervised Contrastive Learning [10.395255631261458]
バイオ音響応用において、ほとんどのタスクにはラベル付きトレーニングデータはほとんど含まれない。
教師付きコントラスト学習フレームワークを用いてデータ拡張を活用することにより、スクラッチからリッチな特徴抽出器を学習することができることを示す。
我々は検証セットで63.46%、テストセットで42.7%のFスコアを取得し、DCASEチャレンジで2位となった。
論文 参考訳(メタデータ) (2023-09-02T09:38:55Z) - Learning to Detect Novel and Fine-Grained Acoustic Sequences Using
Pretrained Audio Representations [17.043435238200605]
我々は,適切な表現を事前学習するための手順を開発し,それを数少ないショット学習シナリオに転送する手法を開発した。
本研究では,AudioSetにおける事前学習表現の汎用性を評価する。
事前訓練された埋め込みは提案したタスクに適しており、数少ないショットフレームワークの複数の側面を可能にする。
論文 参考訳(メタデータ) (2023-05-03T18:41:24Z) - Meta-tuning Loss Functions and Data Augmentation for Few-shot Object
Detection [7.262048441360132]
少ないショットのオブジェクト検出は、少数ショットの学習とオブジェクト検出という領域において、新たなトピックである。
本稿では,数発検出を促進できる帰納的バイアスの学習を可能にする訓練手法を提案する。
提案手法は,高パラメトリックかつ複雑な数ショットメタモデルとは対照的に,解釈可能な損失関数を生成する。
論文 参考訳(メタデータ) (2023-04-24T15:14:16Z) - Meta-DETR: Image-Level Few-Shot Detection with Inter-Class Correlation
Exploitation [100.87407396364137]
画像レベルの最小ショット検出装置であるMeta-DETRを設計し、(i)クラス間相関メタ学習戦略を新たに導入する。
複数の数ショットのオブジェクト検出ベンチマーク実験により、提案したMeta-DETRは最先端の手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-07-30T13:46:07Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - Adaptive Knowledge-Enhanced Bayesian Meta-Learning for Few-shot Event
Detection [34.0901494858203]
イベント検出(ED)は、文中のイベントトリガーワードを検出し、それらを特定のイベントタイプに分類することを目的としている。
本稿では,外部イベント知識を導入するために,定義に基づくエンコーダを用いた知識ベース少ショットイベント検出手法を提案する。
実験により、我々の手法は、少なくとも15個の絶対F1点の基準線を連続的に、実質的に上回っていることが示された。
論文 参考訳(メタデータ) (2021-05-20T04:26:26Z) - Single-Layer Vision Transformers for More Accurate Early Exits with Less
Overhead [88.17413955380262]
視覚変換器アーキテクチャに基づく早期退避のための新しいアーキテクチャを提案する。
本手法は分類問題と回帰問題の両方に有効であることを示す。
また,音声視覚データ解析において,早期出口に音声と視覚のモダリティを統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-19T13:30:34Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Any-Shot Object Detection [81.88153407655334]
「アニーショット検出」とは、全く見えず、数発のカテゴリが推論中に同時に共起できる場所である。
我々は、ゼロショットと少数ショットの両方のオブジェクトクラスを同時に検出できる、統合された任意のショット検出モデルを提案する。
我々のフレームワークは、ゼロショット検出とFewショット検出タスクにのみ使用できる。
論文 参考訳(メタデータ) (2020-03-16T03:43:15Z) - Exploiting the Matching Information in the Support Set for Few Shot
Event Classification [66.31312496170139]
数ショットの学習セットに基づくイベント分類について検討する。
本稿では,学習過程におけるサポートセットを効果的に活用する新たなトレーニング手法を提案する。
2つのベンチマークECデータセットを用いた実験の結果,提案手法は,イベント分類の精度を最大10%向上できることがわかった。
論文 参考訳(メタデータ) (2020-02-13T00:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。