論文の概要: Semi-supervised cross-lingual speech emotion recognition
- arxiv url: http://arxiv.org/abs/2207.06767v2
- Date: Mon, 17 Jul 2023 06:11:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 00:37:34.202779
- Title: Semi-supervised cross-lingual speech emotion recognition
- Title(参考訳): 半教師付き言語間感情認識
- Authors: Mirko Agarla, Simone Bianco, Luigi Celona, Paolo Napoletano, Alexey
Petrovsky, Flavio Piccoli, Raimondo Schettini, Ivan Shanin
- Abstract要約: 言語間音声感情認識は、現実世界のアプリケーションでは依然として課題である。
対象領域にラベル付き例がほとんど存在しない場合に,言語間感情認識のための半教師付き学習(SSL)手法を提案する。
提案手法はトランスフォーマーをベースとして,ラベルなし発話の擬似ラベル付け戦略を活用することで,新しいドメインに適応する。
- 参考スコア(独自算出の注目度): 26.544999411050036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Performance in Speech Emotion Recognition (SER) on a single language has
increased greatly in the last few years thanks to the use of deep learning
techniques. However, cross-lingual SER remains a challenge in real-world
applications due to two main factors: the first is the big gap among the source
and the target domain distributions; the second factor is the major
availability of unlabeled utterances in contrast to the labeled ones for the
new language. Taking into account previous aspects, we propose a
Semi-Supervised Learning (SSL) method for cross-lingual emotion recognition
when only few labeled examples in the target domain (i.e. the new language) are
available. Our method is based on a Transformer and it adapts to the new domain
by exploiting a pseudo-labeling strategy on the unlabeled utterances. In
particular, the use of a hard and soft pseudo-labels approach is investigated.
We thoroughly evaluate the performance of the proposed method in a
speaker-independent setup on both the source and the new language and show its
robustness across five languages belonging to different linguistic strains. The
experimental findings indicate that the unweighted accuracy is increased by an
average of 40% compared to state-of-the-art methods.
- Abstract(参考訳): 近年,一言語での音声感情認識(SER)の性能は,深層学習技術を用いて大幅に向上している。
しかし、第1の要因は、ソースとターゲットドメインの分布の間の大きなギャップであり、第2の要因は、新しい言語のラベル付き発話とは対照的に、ラベルなし発話が主要な可用性である。
従来の側面を考慮して,対象領域(すなわち新しい言語)にラベル付き例がほとんどない場合に,言語間感情認識のためのセミスーパーバイズドラーニング(SSL)手法を提案する。
提案手法はトランスフォーマーをベースとして,ラベルなし発話の擬似ラベル付け戦略を利用して新しいドメインに適応する。
特に,硬質で軟質な擬似ラベルを用いた手法について検討した。
提案手法の性能を,話者に依存しない音源と新言語の両方で徹底的に評価し,異なる言語系統に属する5言語にまたがる頑健性を示す。
実験の結果,非重み付き精度は最先端手法と比較して平均40%向上した。
関連論文リスト
- Crowdsourcing Lexical Diversity [7.569845058082537]
本稿では,レキシコンのバイアス低減のための新しいクラウドソーシング手法を提案する。
群衆労働者は2つの言語からの語彙を比較し、親族や食べ物といった語彙の多様性に富む領域に焦点を当てる。
食品関連用語に焦点をあてた2つのケーススタディに適用し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2024-10-30T15:45:09Z) - A New Method for Cross-Lingual-based Semantic Role Labeling [5.992526851963307]
英語とペルシア語のセマンティック・ロール・ラベリングを訓練するためのディープラーニングアルゴリズムが提案されている。
その結果,Niksirt et al.のモデルと比較すると,有意な改善が認められた。
セマンティックロールラベリングのための言語間メソッドの開発は、約束を守る。
論文 参考訳(メタデータ) (2024-08-28T16:06:12Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - Improving Self-training for Cross-lingual Named Entity Recognition with
Contrastive and Prototype Learning [80.08139343603956]
言語横断的な実体認識において、自己学習は言語的ギャップを埋めるために一般的に用いられる。
本研究では,表現学習と擬似ラベル改善を組み合わせることで,言語間NERの自己学習を改善することを目的とする。
提案手法,すなわちContProtoは主に,(1)コントラスト型自己学習と(2)プロトタイプベース擬似ラベルの2つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-05-23T02:52:16Z) - Few-Shot Cross-Lingual Stance Detection with Sentiment-Based
Pre-Training [32.800766653254634]
本研究は,現在までの言語間スタンス検出に関する最も包括的な研究である。
6つの言語ファミリーの12言語で15の多様なデータセットを使用します。
実験では,新しいラベルエンコーダの追加を提案し,パターン探索トレーニングを構築した。
論文 参考訳(メタデータ) (2021-09-13T15:20:06Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Unsupervised Cross-Lingual Speech Emotion Recognition Using
DomainAdversarial Neural Network [48.1535353007371]
SER(Cross-domain Speech Emotion Recog-nition)は、ソースとターゲットドメイン間の分散シフトによる課題である。
本論文では,この分散シフトを緩和するためのDANN(Domain Adversarial Neural Network)ベースのアプローチを提案する。
論文 参考訳(メタデータ) (2020-12-21T08:21:11Z) - Leveraging Adversarial Training in Self-Learning for Cross-Lingual Text
Classification [52.69730591919885]
本稿では,ラベル保存型入力摂動の最大損失を最小限に抑える半教師付き対向学習法を提案する。
多様な言語群に対する文書分類と意図分類において,有効性が著しく向上するのを観察する。
論文 参考訳(メタデータ) (2020-07-29T19:38:35Z) - Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。
提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。
また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文 参考訳(メタデータ) (2019-12-28T16:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。