論文の概要: Analysis of Self-Supervised Learning and Dimensionality Reduction
Methods in Clustering-Based Active Learning for Speech Emotion Recognition
- arxiv url: http://arxiv.org/abs/2206.10188v1
- Date: Tue, 21 Jun 2022 08:44:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 20:30:09.609355
- Title: Analysis of Self-Supervised Learning and Dimensionality Reduction
Methods in Clustering-Based Active Learning for Speech Emotion Recognition
- Title(参考訳): クラスタリングに基づく音声感情認識のための能動学習における自己教師あり学習と次元低減手法の解析
- Authors: Einari Vaaras, Manu Airaksinen, Okko R\"as\"anen
- Abstract要約: 本稿では,クラスタリングに基づくアクティブラーニング(AL)手法における特徴空間の構造の使い方を示す。
本稿では,クラスタリングに基づくALの関数化手法の探索において,CPCと多次元化手法を組み合わせる。
音声感情認識システム展開のシミュレーション実験により,特徴空間の局所的および大域的トポロジをALに応用できることが示唆された。
- 参考スコア(独自算出の注目度): 3.3670613441132984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When domain experts are needed to perform data annotation for complex
machine-learning tasks, reducing annotation effort is crucial in order to cut
down time and expenses. For cases when there are no annotations available, one
approach is to utilize the structure of the feature space for clustering-based
active learning (AL) methods. However, these methods are heavily dependent on
how the samples are organized in the feature space and what distance metric is
used. Unsupervised methods such as contrastive predictive coding (CPC) can
potentially be used to learn organized feature spaces, but these methods
typically create high-dimensional features which might be challenging for
estimating data density. In this paper, we combine CPC and multiple
dimensionality reduction methods in search of functioning practices for
clustering-based AL. Our experiments for simulating speech emotion recognition
system deployment show that both the local and global topology of the feature
space can be successfully used for AL, and that CPC can be used to improve
clustering-based AL performance over traditional signal features. Additionally,
we observe that compressing data dimensionality does not harm AL performance
substantially, and that 2-D feature representations achieved similar AL
performance as higher-dimensional representations when the number of
annotations is not very low.
- Abstract(参考訳): ドメインの専門家が複雑な機械学習タスクのためにデータアノテーションを実行する必要がある場合、時間と費用を削減するためにアノテーションの労力を減らすことが重要です。
アノテーションがない場合、ひとつのアプローチは、クラスタリングベースのアクティブラーニング(AL)メソッドに機能空間の構造を利用することです。
しかし、これらの手法は、どのようにサンプルが特徴空間に整理され、どの距離メートル法が使用されるかに大きく依存する。
コントラスト予測符号化(cpc)のような教師なしの手法は、組織化された特徴空間を学ぶのに使用できるが、これらの手法は通常、データ密度を推定するのに難しい高次元の特徴を生み出す。
本稿では,クラスタリングに基づくALの関数化手法の探索において,CPCと多次元化手法を組み合わせる。
音声感情認識システム展開のシミュレーション実験により,特徴空間の局所的および大域的トポロジがALに有効であり,CPCは従来の信号特徴よりもクラスタリングに基づくAL性能を向上させることができることを示した。
さらに,データ次元の圧縮がAL性能を著しく損なうことはなく,アノテーションの数が少ない場合の高次元表現と同様に2次元特徴表現がAL性能に類似していることが観察された。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Beyond Prototypes: Semantic Anchor Regularization for Better
Representation Learning [82.29761875805369]
表現学習の最終的な目標の1つは、クラス内のコンパクトさとクラス間の十分な分離性を達成することである。
本稿では,機能セントロイドとして機能する事前定義されたクラスアンカーを用いて,特徴学習を一方向ガイドする新しい視点を提案する。
提案したSemantic Anchor Regularization (SAR) は,既存モデルのプラグアンドプレイ方式で使用することができる。
論文 参考訳(メタデータ) (2023-12-19T05:52:38Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Hyperspherical Consistency Regularization [45.00073340936437]
我々は,自己教師あり学習と教師あり学習の関係について検討し,自己教師あり学習がデータ効率のよい深層学習にどのように役立つかを検討する。
超球面整合正則化(HCR)を提案し,特徴依存情報を用いた分類器の正規化を行い,ラベルからのバイアスを回避する。
論文 参考訳(メタデータ) (2022-06-02T02:41:13Z) - Spacing Loss for Discovering Novel Categories [72.52222295216062]
新たなクラスディスカバリ(NCD)は、マシンラーニングモデルがラベルのないデータからインスタンスを意味的にグループ化する、学習パラダイムである。
まず,ラベル付きデータとラベルなしデータを併用する必要があるかどうかに基づいて,既存のNCD手法を1段階および2段階の手法に特徴付ける。
多次元スケーリングのキューを用いて、潜在空間における分離性を強制する単純で強力な損失関数を考案する。
論文 参考訳(メタデータ) (2022-04-22T09:37:11Z) - Clustering augmented Self-Supervised Learning: Anapplication to Land
Cover Mapping [10.720852987343896]
本稿では,自己教師型学習のためのクラスタリングに基づくプレテキストタスクを用いて,土地被覆マッピングの新しい手法を提案する。
社会的に関係のある2つのアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-08-16T19:35:43Z) - ReliefE: Feature Ranking in High-dimensional Spaces via Manifold
Embeddings [0.0]
リリーフ・ファミリのアルゴリズムは、最も重要で無関係なインスタンスを反復的に計算することで、機能に重要性を割り当てる。
最近の埋め込みベース手法はコンパクトな低次元表現を学習する。
ReliefEアルゴリズムは高速で、機能ランキングが向上する可能性がある。
論文 参考訳(メタデータ) (2021-01-23T20:23:31Z) - Fantastic Features and Where to Find Them: Detecting Cognitive
Impairment with a Subsequence Classification Guided Approach [6.063165888023164]
本稿では、逐次機械学習モデルとドメイン知識を活用して、パフォーマンス向上に役立つ機能を予測する機能エンジニアリングの新しいアプローチについて説明する。
本手法により得られた特徴を用いた場合,CI分類精度が強いベースラインよりも2.3%向上することが実証された。
論文 参考訳(メタデータ) (2020-10-13T17:57:18Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。