論文の概要: Power pooling: An adaptive pooling function for weakly labelled sound
event detection
- arxiv url: http://arxiv.org/abs/2010.09985v2
- Date: Wed, 20 Jan 2021 07:50:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 08:06:52.100918
- Title: Power pooling: An adaptive pooling function for weakly labelled sound
event detection
- Title(参考訳): パワープーリング:弱ラベル付き音響イベント検出のための適応型プーリング機能
- Authors: Yuzhuo Liu, Hangting Chen, YunWang and Pengyuan Zhang
- Abstract要約: 本稿では,様々な音源に適応可能な適応型パワープーリング機能を提案する。
2つのパブリックデータセットにおいて、提案されたパワープーリング機能は、最先端の線形ソフトマックスプーリングよりも優れている。
本稿では,音響事象検出アプリケーションに焦点をあてるが,提案手法は他の領域のMILタスクにも適用できる。
- 参考スコア(独自算出の注目度): 22.663069850833963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Access to large corpora with strongly labelled sound events is expensive and
difficult in engineering applications. Much research turns to address the
problem of how to detect both the types and the timestamps of sound events with
weak labels that only specify the types. This task can be treated as a multiple
instance learning (MIL) problem, and the key to it is the design of a pooling
function. In this paper, we propose an adaptive power pooling function which
can automatically adapt to various sound sources. On two public datasets, the
proposed power pooling function outperforms the state-of-the-art linear softmax
pooling on both coarsegrained and fine-grained metrics. Notably, it improves
the event-based F1 score (which evaluates the detection of event onsets and
offsets) by 11.4% and 10.2% relative on the two datasets. While this paper
focuses on sound event detection applications, the proposed method can be
applied to MIL tasks in other domains.
- Abstract(参考訳): 強いラベル付きサウンドイベントを持つ大きなコーパスへのアクセスは、エンジニアリングアプリケーションでは高価で困難である。
多くの研究は、タイプのみを指定する弱いラベルを持つ音事象の型とタイムスタンプの両方を検出する方法の問題に対処している。
このタスクは、マルチインスタンス学習(mil)の問題として扱うことができ、その鍵は、プーリング関数の設計である。
本稿では,様々な音源に適応可能な適応型パワープーリング機能を提案する。
2つの公開データセットにおいて、提案する電力プーリング関数は、粗粒度と細粒度の両方で最先端の線形ソフトマックスプーリングよりも優れている。
特に、イベントベースのF1スコア(イベントのオンセットとオフセットの検出を評価する)を2つのデータセットに対して11.4%と10.2%改善している。
本稿では,音響事象検出アプリケーションに焦点をあてるが,提案手法は他の領域のMILタスクにも適用できる。
関連論文リスト
- DiffSED: Sound Event Detection with Denoising Diffusion [70.18051526555512]
生成学習の観点からSED問題を再構築する。
具体的には,騒音拡散過程において,雑音のある提案から音の時間境界を生成することを目的としている。
トレーニング中は,ノイズの多い遅延クエリを基本バージョンに変換することで,ノイズ発生過程の逆転を学習する。
論文 参考訳(メタデータ) (2023-08-14T17:29:41Z) - Abnormal Event Detection via Hypergraph Contrastive Learning [54.80429341415227]
異常事象検出は多くの実アプリケーションにおいて重要な役割を果たす。
本稿では,分散異種情報ネットワークにおける異常事象検出問題について検討する。
AEHCLと呼ばれる新しいハイパーグラフコントラスト学習法が,異常事象のパターンをフルに捉えるために提案されている。
論文 参考訳(メタデータ) (2023-04-02T08:23:20Z) - Balanced Deep CCA for Bird Vocalization Detection [5.635374645175903]
マルチモーダルデータのための新しい自己教師付き学習手法を開発した。
同時に記録したマイクロホン(音)信号と加速度計(振動)信号との相関(隠れ)を学習する。
論文 参考訳(メタデータ) (2022-11-17T07:09:07Z) - Segment-level Metric Learning for Few-shot Bioacoustic Event Detection [56.59107110017436]
本稿では,モデル最適化時の肯定的事象と否定的事象の両方を利用するセグメントレベルの数ショット学習フレームワークを提案する。
本システムでは,DCASE2022チャレンジタスク5(DCASE2022-T5)のF値62.73の検証を行い,ベースラインプロトタイプネットワーク34.02の性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2022-07-15T22:41:30Z) - Ev-TTA: Test-Time Adaptation for Event-Based Object Recognition [7.814941658661939]
Ev-TTAは、イベントベースのオブジェクト認識のためのシンプルで効果的なテスト時間適応である。
我々の定式化は、入力表現に関係なくうまく適用でき、回帰タスクに拡張できる。
論文 参考訳(メタデータ) (2022-03-23T07:43:44Z) - ProgressiveMotionSeg: Mutually Reinforced Framework for Event-Based
Motion Segmentation [101.19290845597918]
本稿では,動作推定 (ME) モジュールとイベントデノイング (ED) モジュールを相互に強化された方法で共同最適化する。
時間的相関をガイダンスとして、EDモジュールは各イベントが実活動イベントに属するという信頼度を算出し、MEモジュールに送信し、ノイズ抑制のための運動セグメンテーションのエネルギー関数を更新する。
論文 参考訳(メタデータ) (2022-03-22T13:40:26Z) - A Machine Learning Framework for Event Identification via Modal Analysis
of PMU Data [17.105110901241094]
本稿では,モーダルダイナミクスに基づく特徴抽出によるイベントの同定を提案する。
従来の物理に基づく特徴抽出手法と機械学習を組み合わせて、異なるイベントタイプを区別する。
以上の結果から,提案フレームワークは2種類のイベントを識別できる可能性が示唆された。
論文 参考訳(メタデータ) (2022-02-14T16:19:40Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - Learning Constraints and Descriptive Segmentation for Subevent Detection [74.48201657623218]
本稿では,サブイベント検出とEventSeg予測の依存関係をキャプチャする制約を学習し,強制するアプローチを提案する。
我々は制約学習にRectifier Networksを採用し、学習した制約をニューラルネットワークの損失関数の正規化項に変換する。
論文 参考訳(メタデータ) (2021-09-13T20:50:37Z) - Improving weakly supervised sound event detection with self-supervised
auxiliary tasks [33.427215114252235]
本稿では,音声イベント検出を主課題とする共有エンコーダアーキテクチャと,自己教師型補助課題のための追加の二次デコーダを提案する。
我々は,DCASE 2019タスク1音響シーンデータのリミックスデータセットを用いて,弱教師付き音響イベント検出のためのフレームワークを実験的に評価した。
提案したフレームワークは、既存のベンチマークモデルを22.3%、12.8%、0、10、20dB SNRの5.9%で上回っている。
論文 参考訳(メタデータ) (2021-06-12T20:28:22Z) - Multi-Task Learning for Interpretable Weakly Labelled Sound Event
Detection [34.99472489405047]
本稿では,Wakly Labelled Audioデータから学習するマルチタスク学習フレームワークを提案する。
選択した補助タスクは内部のT-F表現を消音し、ノイズの多い記録下でのSED性能を向上させる。
提案した全フレームワークは、すべてのSNRで既存のベンチマークモデルを上回っている。
論文 参考訳(メタデータ) (2020-08-17T04:46:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。