論文の概要: Unsupervised Cross-Lingual Speech Emotion Recognition Using
DomainAdversarial Neural Network
- arxiv url: http://arxiv.org/abs/2012.11174v1
- Date: Mon, 21 Dec 2020 08:21:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 06:25:05.854139
- Title: Unsupervised Cross-Lingual Speech Emotion Recognition Using
DomainAdversarial Neural Network
- Title(参考訳): domainadversarial neural networkを用いた教師なし言語間音声感情認識
- Authors: Xiong Cai, Zhiyong Wu, Kuo Zhong, Bin Su, Dongyang Dai, Helen Meng
- Abstract要約: SER(Cross-domain Speech Emotion Recog-nition)は、ソースとターゲットドメイン間の分散シフトによる課題である。
本論文では,この分散シフトを緩和するためのDANN(Domain Adversarial Neural Network)ベースのアプローチを提案する。
- 参考スコア(独自算出の注目度): 48.1535353007371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: By using deep learning approaches, Speech Emotion Recog-nition (SER) on a
single domain has achieved many excellentresults. However, cross-domain SER is
still a challenging taskdue to the distribution shift between source and target
domains.In this work, we propose a Domain Adversarial Neural Net-work (DANN)
based approach to mitigate this distribution shiftproblem for cross-lingual
SER. Specifically, we add a languageclassifier and gradient reversal layer
after the feature extractor toforce the learned representation both
language-independent andemotion-meaningful. Our method is unsupervised, i. e.,
labelson target language are not required, which makes it easier to ap-ply our
method to other languages. Experimental results showthe proposed method
provides an average absolute improve-ment of 3.91% over the baseline system for
arousal and valenceclassification task. Furthermore, we find that batch
normaliza-tion is beneficial to the performance gain of DANN. Thereforewe also
explore the effect of different ways of data combinationfor batch
normalization.
- Abstract(参考訳): ディープラーニングアプローチを用いることで、単一ドメインの音声感情認識(ser)は多くの優れた結果を得た。
しかし、ドメイン間SERは、依然としてソースとターゲットドメイン間の分散シフトの課題であり、本研究では、この分散シフトを言語間SERに緩和するドメイン適応ニューラルネットワーク(DANN)に基づくアプローチを提案する。
具体的には,特徴抽出器の後に言語分類器と勾配反転層を追加し,学習表現を強制する。
我々の手法は教師なし、すなわちラベルソンターゲット言語は不要であるので、他の言語にメソッドをp-plyするのが容易である。
実験結果から,提案手法は平均3.91%の絶対値向上を実現し,平均値と平均値の分類を行った。
さらに,バッチ正規化はDANNの性能向上に有益であることがわかった。
したがって、バッチ正規化のためのデータ組み合わせの異なる方法の影響についても検討する。
関連論文リスト
- Reducing Source-Private Bias in Extreme Universal Domain Adaptation [11.875619863954238]
Universal Domain Adaptation (UniDA)は、ラベル付きソースドメインからラベル付きターゲットドメインに知識を転送することを目的としている。
我々は、ソースドメインが重複するクラスよりもはるかに重複しないクラスを持つ場合、最先端のメソッドが苦労していることを示す。
対象データの構造を保存するために,自己教師付き学習を提案する。
論文 参考訳(メタデータ) (2024-10-15T04:51:37Z) - FIT: Frequency-based Image Translation for Domain Adaptive Object
Detection [8.635264598464355]
ドメイン適応オブジェクト検出(DAOD)のための新しい周波数ベース画像変換(FIT)フレームワークを提案する。
まず、ドメイン不変周波数成分を保持し、ドメイン固有周波数成分を交換することで、画像変換を行い、入力レベルでのドメインシフトを低減する。
第二に、階層的対角的特徴学習を用いて、特徴レベルでのドメインギャップをさらに緩和する。
論文 参考訳(メタデータ) (2023-03-07T07:30:08Z) - Self-training through Classifier Disagreement for Cross-Domain Opinion
Target Extraction [62.41511766918932]
オピニオンターゲット抽出(OTE)またはアスペクト抽出(AE)は意見マイニングの基本的な課題である。
最近の研究は、現実世界のシナリオでよく見られるクロスドメインのOTEに焦点を当てている。
そこで本稿では,ドメイン固有の教師と学生のネットワークから出力されるモデルが未学習のターゲットデータと一致しない対象サンプルを選択するためのSSLアプローチを提案する。
論文 参考訳(メタデータ) (2023-02-28T16:31:17Z) - Semi-supervised cross-lingual speech emotion recognition [26.544999411050036]
言語間音声感情認識は、現実世界のアプリケーションでは依然として課題である。
対象領域にラベル付き例がほとんど存在しない場合に,言語間感情認識のための半教師付き学習(SSL)手法を提案する。
提案手法はトランスフォーマーをベースとして,ラベルなし発話の擬似ラベル付け戦略を活用することで,新しいドメインに適応する。
論文 参考訳(メタデータ) (2022-07-14T09:24:55Z) - Stagewise Unsupervised Domain Adaptation with Adversarial Self-Training
for Road Segmentation of Remote Sensing Images [93.50240389540252]
リモートセンシング画像からの道路セグメンテーションは、幅広い応用可能性を持つ課題である。
本稿では,この領域における領域シフト(DS)問題に対処するため,RoadDAと呼ばれる新たな段階的ドメイン適応モデルを提案する。
2つのベンチマーク実験の結果、RoadDAはドメインギャップを効率的に減らし、最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-08-28T09:29:14Z) - OVANet: One-vs-All Network for Universal Domain Adaptation [78.86047802107025]
既存のメソッドは、検証または未知のサンプルの事前定義された比率に基づいて未知のサンプルを拒否するしきい値を手動で設定します。
本稿では,ソースサンプルを用いて閾値を学習し,対象領域に適応する手法を提案する。
私たちの考えは、ソースドメインの最小クラス間距離は、ターゲットの既知のか未知かを決定するための良いしきい値であるべきです。
論文 参考訳(メタデータ) (2021-04-07T18:36:31Z) - Effective Label Propagation for Discriminative Semi-Supervised Domain
Adaptation [76.41664929948607]
半教師付き領域適応(SSDA)法は,大規模な画像分類タスクにおいて大きな可能性を示している。
本稿では、ドメイン間およびドメイン内セマンティック情報を効果的に伝達することにより、この問題に対処する新しい効果的な方法を提案する。
ソースコードと事前訓練されたモデルも間もなくリリースされる予定です。
論文 参考訳(メタデータ) (2020-12-04T14:28:19Z) - Alleviating Semantic-level Shift: A Semi-supervised Domain Adaptation
Method for Semantic Segmentation [97.8552697905657]
このタスクの重要な課題は、ソースとターゲットドメイン間のデータ分散の相違を緩和する方法である。
本稿では,グローバルな視点とローカルな視点の両方から分布の整合性を促進できるASS(Alleviating Semantic-level Shift)を提案する。
GTA5、Cityscapes、Synthia、Cityscapesの2つのドメイン適応タスクにASSを適用します。
論文 参考訳(メタデータ) (2020-04-02T03:25:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。