論文の概要: Attentive Max Feature Map for Acoustic Scene Classification with Joint
Learning considering the Abstraction of Classes
- arxiv url: http://arxiv.org/abs/2104.07213v1
- Date: Thu, 15 Apr 2021 03:14:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-17 05:01:10.062048
- Title: Attentive Max Feature Map for Acoustic Scene Classification with Joint
Learning considering the Abstraction of Classes
- Title(参考訳): 授業の抽象性を考慮した共同学習による音響シーン分類のための注意的最大特徴マップ
- Authors: Hye-jin Shim, Ju-ho Kim, Jee-weon Jung, Ha-Jin Yu
- Abstract要約: 本稿では,注意機構の解明と現象の緩和のために,注意と最大特徴写像の2つの効果的な手法を組み合わせた注意最大特徴写像と呼ばれる機構を提案する。
提案手法を2つ適用し,サブタスクA上での単一システム間の最先端の性能を実現した。
- 参考スコア(独自算出の注目度): 48.6946385738143
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The attention mechanism has been widely adopted in acoustic scene
classification. However, we find that during the process of attention
exclusively emphasizing information, it tends to excessively discard
information although improving the performance. We propose a mechanism referred
to as the attentive max feature map which combines two effective techniques,
attention and max feature map, to further elaborate the attention mechanism and
mitigate the abovementioned phenomenon. Furthermore, we explore various joint
learning methods that utilize additional labels originally generated for
subtask B (3-classes) on top of existing labels for subtask A (10-classes) of
the DCASE2020 challenge. We expect that using two kinds of labels
simultaneously would be helpful because the labels of the two subtasks differ
in their degree of abstraction. Applying two proposed techniques, our proposed
system achieves state-of-the-art performance among single systems on subtask A.
In addition, because the model has a complexity comparable to subtask B's
requirement, it shows the possibility of developing a system that fulfills the
requirements of both subtasks; generalization on multiple devices and
low-complexity.
- Abstract(参考訳): 注意機構は音響シーン分類において広く採用されている。
しかし,情報のみに注目する過程では,性能が向上する一方,過度に情報を捨てる傾向にあることがわかった。
そこで本研究では、注意機構をさらに詳しく解明し、上記の現象を緩和するために、注意と最大特徴写像の2つの効果的な手法を組み合わせた注意最大特徴写像と呼ばれるメカニズムを提案する。
さらに,DCASE2020チャレンジにおいて,既存のサブタスクA(10クラス)のラベルの上に,もともとサブタスクB(3クラス)用に生成された追加ラベルを利用する様々な共同学習手法について検討する。
2種類のラベルを同時に使用することは,2つのサブタスクのラベルが抽象化の程度が異なるため,有効であると考えています。
提案手法を2つ適用することにより,サブタスクA上の単一システム間の最先端性能を実現する。
さらに、このモデルはサブタスクbの要求に匹敵する複雑さを持っているため、サブタスクの両方の要求を満たすシステムを開発する可能性を示している。
関連論文リスト
- Auxiliary Tasks Enhanced Dual-affinity Learning for Weakly Supervised
Semantic Segmentation [79.05949524349005]
AuxSegNet+は、サリエンシマップから豊富な情報を探索する弱教師付き補助学習フレームワークである。
また,サリエンシとセグメンテーションの特徴マップから画素レベルの親和性を学習するためのクロスタスク親和性学習機構を提案する。
論文 参考訳(メタデータ) (2024-03-02T10:03:21Z) - IntenDD: A Unified Contrastive Learning Approach for Intent Detection
and Discovery [12.905097743551774]
バックボーンを符号化する共有発話を利用した統一手法であるIntenDDを提案する。
IntenDDは完全に教師なしのコントラスト学習戦略を用いて表現学習を行う。
当社のアプローチは,3つのタスクのすべてにおいて,競争上のベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2023-10-25T16:50:24Z) - Slot Induction via Pre-trained Language Model Probing and Multi-level
Contrastive Learning [62.839109775887025]
トークンレベルのスロットアノテーションの明示的な知識なしでスロット境界を誘導することを目的としたスロットインジェクション(SI)タスク。
PLMから抽出した教師なし意味知識を活用するために、教師なし事前学習言語モデル(PLM)探索とコントラスト学習機構を活用することを提案する。
提案手法は,2つのNLUベンチマークデータセット上でトークンレベルの教師付きモデルとのギャップを埋めることができ,SIタスクに有効であることが示されている。
論文 参考訳(メタデータ) (2023-08-09T05:08:57Z) - Joint Alignment of Multi-Task Feature and Label Spaces for Emotion Cause
Pair Extraction [36.123715709125015]
感情原因ペア抽出(ECPE)は、感情原因分析(ECA)の派生したサブタスクの1つである。
ECPEは感情抽出(EE)と原因抽出(CE)に関連性のある豊富な特徴を共有している
論文 参考訳(メタデータ) (2022-09-09T04:06:27Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Weakly Supervised Semantic Segmentation via Alternative Self-Dual
Teaching [82.71578668091914]
本稿では,分類とマスク・リファインメント・コンポーネントを統合された深層モデルに組み込む,コンパクトな学習フレームワークを確立する。
本稿では,高品質な知識相互作用を促進するために,新たな自己双対学習(ASDT)機構を提案する。
論文 参考訳(メタデータ) (2021-12-17T11:56:56Z) - Towards Joint Intent Detection and Slot Filling via Higher-order
Attention [47.78365472691051]
Intent Detection (ID) と Slot fill (SF) は、音声言語理解(SLU)における2つの主要なタスクである。
本稿では,文脈的およびチャネル的両線的アテンション分布を利用したバイリニアアテンションブロックを提案する。
我々のアプローチは最先端のアプローチと比較して改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-09-18T09:50:23Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - Multi-Label Few-Shot Learning for Aspect Category Detection [23.92900196246631]
感情分析におけるアスペクトカテゴリー検出(ACD)は、文中のアスペクトカテゴリを特定することを目的としている。
既存の数発の学習アプローチは、主にシングルラベルの予測に焦点を当てている。
本稿では,プロトタイプネットワークに基づく複数ラベルの複数ショット学習手法を提案する。
論文 参考訳(メタデータ) (2021-05-29T01:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。