論文の概要: Semi Supervised Learning For Few-shot Audio Classification By Episodic
Triplet Mining
- arxiv url: http://arxiv.org/abs/2102.08074v1
- Date: Tue, 16 Feb 2021 10:55:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-17 14:47:38.448431
- Title: Semi Supervised Learning For Few-shot Audio Classification By Episodic
Triplet Mining
- Title(参考訳): エピソディック・トリプレット・マイニングによるフェーショット音声分類のための半教師付き学習
- Authors: Swapnil Bhosale, Rupayan Chakraborty, Sunil Kumar Kopparapu
- Abstract要約: 少数ショット学習は、テスト中に現れるが、トレーニング中に使用できない未発見のクラスを一般化することを目的としている。
プロトタイプネットワークは、クラス内の埋め込みサポートポイントの平均ベクトルの形でクラスプロトタイプを構築することによって、少数のショットメトリック学習を組み込む。
本稿では,典型的な原型損失関数をエピソードトリプルトマイニング(ETM)技術で置き換えることを提案する。
- 参考スコア(独自算出の注目度): 29.316760645668346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning aims to generalize unseen classes that appear during
testing but are unavailable during training. Prototypical networks incorporate
few-shot metric learning, by constructing a class prototype in the form of a
mean vector of the embedded support points within a class. The performance of
prototypical networks in extreme few-shot scenarios (like one-shot) degrades
drastically, mainly due to the desuetude of variations within the clusters
while constructing prototypes. In this paper, we propose to replace the typical
prototypical loss function with an Episodic Triplet Mining (ETM) technique. The
conventional triplet selection leads to overfitting, because of all possible
combinations being used during training. We incorporate episodic training for
mining the semi hard positive and the semi hard negative triplets to overcome
the overfitting. We also propose an adaptation to make use of unlabeled
training samples for better modeling. Experimenting on two different audio
processing tasks, namely speaker recognition and audio event detection; show
improved performances and hence the efficacy of ETM over the prototypical loss
function and other meta-learning frameworks. Further, we show improved
performances when unlabeled training samples are used.
- Abstract(参考訳): 少数ショット学習は、テスト中に現れるが、トレーニング中に使用できない未発見のクラスを一般化することを目的としている。
プロトタイプネットワークは、クラス内の埋め込みサポートポイントの平均ベクトルの形でクラスプロトタイプを構築することによって、少数のショットメトリック学習を組み込む。
極端に少数のシナリオ(ワンショットなど)での原型的ネットワークのパフォーマンスは、主にプロトタイプの構築中にクラスタ内のバリエーションが減り、大幅に低下する。
本稿では,典型的な原型損失関数をエピソードトリプルトマイニング(ETM)技術で置き換えることを提案する。
通常の三重項選択は、トレーニング中に全ての組み合わせが使用されるため、過度に適合する。
我々は, 半硬度三重項と半硬度三重項のマイニングにエピソディクストレーニングを取り入れ, オーバーフィッティングを克服した。
また,ラベルなしのトレーニングサンプルをモデリングに利用するための適応法を提案する。
話者認識と音声イベント検出という2つの異なるオーディオ処理タスクの実験は、パフォーマンスの改善と、原型損失関数や他のメタラーニングフレームワークに対するETMの有効性を示しています。
さらに,未ラベルのトレーニングサンプルを用いた場合の性能向上を示す。
関連論文リスト
- Segment-level Metric Learning for Few-shot Bioacoustic Event Detection [56.59107110017436]
本稿では,モデル最適化時の肯定的事象と否定的事象の両方を利用するセグメントレベルの数ショット学習フレームワークを提案する。
本システムでは,DCASE2022チャレンジタスク5(DCASE2022-T5)のF値62.73の検証を行い,ベースラインプロトタイプネットワーク34.02の性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2022-07-15T22:41:30Z) - Partner-Assisted Learning for Few-Shot Image Classification [54.66864961784989]
人間の視覚能力を模倣し、徹底的な人間のアノテーションを必要とせずに効果的なモデルを学ぶために、わずかなショットラーニングが研究されている。
本稿では,新しいクラスのプロトタイプをラベル付きサンプルから推定できるように,要素表現を得るためのトレーニング戦略の設計に焦点をあてる。
本稿では,まずパートナーエンコーダのペアワイド類似性をモデル化し,ソフトアンカーとして機能する特徴を抽出し,その出力をソフトアンカーと整列させ,分類性能を最大化しようとする2段階トレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T22:46:19Z) - Trainable Class Prototypes for Few-Shot Learning [5.481942307939029]
本稿では,メタトレーニングとタスクトレーニングの枠組みにおいて,距離測定のためのトレーニング可能なプロトタイプを提案する。
また, エピソードなメタトレーニングがもたらした欠点を避けるために, 自己教師型学習に基づく非エピソードなメタトレーニングを採用する。
本手法は,標準的な数ショットの視覚的分類データセット上で,多数の確立された数ショットタスクにおいて,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-06-21T04:19:56Z) - Semi-Supervised Few-Shot Classification with Deep Invertible Hybrid
Models [4.189643331553922]
半教師付き小ショット分類のための潜在空間レベルで識別学習と生成学習を統合するディープ・インバーチブルハイブリッドモデルを提案する。
我々の主な独創性は、これらのコンポーネントを潜在空間レベルで統合することであり、過度な適合を防ぐのに有効である。
論文 参考訳(メタデータ) (2021-05-22T05:55:16Z) - MT3: Meta Test-Time Training for Self-Supervised Test-Time Adaption [69.76837484008033]
ディープラーニングの未解決の問題は、ニューラルネットワークがテスト時間中のドメインシフトに対処する能力である。
メタラーニング、自己監督、テストタイムトレーニングを組み合わせて、目に見えないテスト分布に適応する方法を学びます。
この手法はcifar-10による画像分類ベンチマークの最先端結果を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-30T09:33:38Z) - Contrastive Prototype Learning with Augmented Embeddings for Few-Shot
Learning [58.2091760793799]
拡張埋め込み(CPLAE)モデルを用いた新しいコントラスト型プロトタイプ学習を提案する。
クラスプロトタイプをアンカーとして、CPLは、同じクラスのクエリサンプルを、異なるクラスのサンプルを、さらに遠くに引き出すことを目的としている。
いくつかのベンチマークによる大規模な実験により,提案したCPLAEが新たな最先端を実現することが示された。
論文 参考訳(メタデータ) (2021-01-23T13:22:44Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Learning and Memorizing Representative Prototypes for 3D Point Cloud
Semantic and Instance Segmentation [117.29799759864127]
3Dポイントクラウドセマンティクスとインスタンスセグメンテーションは、3Dシーン理解にとって不可欠で基本である。
深層ネットワークは、学習過程における非支配的なケースを忘れやすく、不満足なパフォーマンスをもたらす。
本稿では,多様なサンプルを普遍的にカバーする代表プロトタイプを学習し,記憶するメモリ拡張ネットワークを提案する。
論文 参考訳(メタデータ) (2020-01-06T01:07:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。