論文の概要: ERNetCL: A novel emotion recognition network in textual conversation
based on curriculum learning strategy
- arxiv url: http://arxiv.org/abs/2308.06450v2
- Date: Thu, 25 Jan 2024 09:42:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 18:00:45.757768
- Title: ERNetCL: A novel emotion recognition network in textual conversation
based on curriculum learning strategy
- Title(参考訳): ERNetCL:カリキュラム学習戦略に基づくテキスト会話における新しい感情認識ネットワーク
- Authors: Jiang Li, Xiaoping Wang, Yingjian Liu, Zhigang Zeng
- Abstract要約: カリキュラム学習戦略(ERNetCL)に基づく新しい感情認識ネットワークを提案する。
提案するERNetCLは主に、時間エンコーダ(TE)、空間エンコーダ(SE)、カリキュラムラーニング(CL)損失からなる。
提案手法は有効であり,他のベースラインモデルに劇的に勝っている。
- 参考スコア(独自算出の注目度): 37.41082775317849
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotion recognition in conversation (ERC) has emerged as a research hotspot
in domains such as conversational robots and question-answer systems. How to
efficiently and adequately retrieve contextual emotional cues has been one of
the key challenges in the ERC task. Existing efforts do not fully model the
context and employ complex network structures, resulting in limited performance
gains. In this paper, we propose a novel emotion recognition network based on
curriculum learning strategy (ERNetCL). The proposed ERNetCL primarily consists
of temporal encoder (TE), spatial encoder (SE), and curriculum learning (CL)
loss. We utilize TE and SE to combine the strengths of previous methods in a
simplistic manner to efficiently capture temporal and spatial contextual
information in the conversation. To ease the harmful influence resulting from
emotion shift and simulate the way humans learn curriculum from easy to hard,
we apply the idea of CL to the ERC task to progressively optimize the network
parameters. At the beginning of training, we assign lower learning weights to
difficult samples. As the epoch increases, the learning weights for these
samples are gradually raised. Extensive experiments on four datasets exhibit
that our proposed method is effective and dramatically beats other baseline
models.
- Abstract(参考訳): 会話における感情認識(ERC)は、会話ロボットや質問応答システムといった領域において研究ホットスポットとして現れている。
文脈的感情的な手がかりを効果的かつ適切に回収する方法は、ERCタスクにおける重要な課題の1つです。
既存の取り組みは、コンテキストを完全にモデル化せず、複雑なネットワーク構造を採用する。
本稿では,カリキュラム学習戦略(ERNetCL)に基づく新しい感情認識ネットワークを提案する。
提案するERNetCLは主に、時間エンコーダ(TE)、空間エンコーダ(SE)、カリキュラム学習(CL)損失からなる。
TEとSEを用いて、従来の手法の強みを簡易に組み合わせ、会話における時間的・空間的な情報を効率的に捉える。
感情変化による有害な影響を緩和し、人間のカリキュラム学習を容易かつ困難にシミュレートするために、clのアイデアをercタスクに適用し、ネットワークパラメータを漸進的に最適化する。
トレーニング開始時に,難解なサンプルに低い学習重みを割り当てる。
時代が進むにつれて、これらのサンプルの学習重量は徐々に上昇する。
4つのデータセットに関する広範囲な実験により,提案手法が有効であることを示し,他のベースラインモデルと劇的に比較した。
関連論文リスト
- Semantic Meta-Split Learning: A TinyML Scheme for Few-Shot Wireless Image Classification [50.28867343337997]
本研究は,TinyMLを用いた無線画像分類のためのセマンティック・コミュニケーション・フレームワークを提案する。
我々は、プライバシ保護を確保しつつ、エンドユーザーによって実行される計算を制限するために分割学習を利用する。
メタ学習は、データ可用性の懸念を克服し、同様のトレーニングされたタスクを利用することで、トレーニングを高速化する。
論文 参考訳(メタデータ) (2024-09-03T05:56:55Z) - Contrastive Augmentation: An Unsupervised Learning Approach for Keyword Spotting in Speech Technology [4.080686348274667]
教師なしコントラスト学習と拡張一意的手法を組み合わせた新しい手法を提案する。
我々の方法では、ニューラルネットワークがラベルのないデータセットでトレーニングすることができ、下流タスクのパフォーマンスが向上する可能性がある。
本稿では,ボトルネック層の特徴と音声再構成情報との類似性を利用した音声強化に基づく教師なし学習手法を提案する。
論文 参考訳(メタデータ) (2024-08-31T05:40:37Z) - Text-Video Retrieval with Global-Local Semantic Consistent Learning [122.15339128463715]
我々は,シンプルで効果的なグローバル局所意味的一貫性学習(GLSCL)を提案する。
GLSCLは、テキストビデオ検索のためのモダリティをまたいだ潜在共有セマンティクスを活用する。
本手法はSOTAと同等の性能を実現し,計算コストの約220倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-05-21T11:59:36Z) - Curriculum Learning Meets Directed Acyclic Graph for Multimodal Emotion
Recognition [2.4660652494309936]
MultiDAG+CLは会話におけるマルチモーダル感情認識の新しいアプローチ
このモデルはCurriculum Learning (CL)によって強化され、感情の変化やデータの不均衡に関連する課題に対処する。
IEMOCAPとMELDデータセットの実験結果は、MultiDAG+CLモデルがベースラインモデルより優れていることを示している。
論文 参考訳(メタデータ) (2024-02-27T07:28:05Z) - Supervised Prototypical Contrastive Learning for Emotion Recognition in
Conversation [25.108385802645163]
本稿では,感情認識タスクにおけるSPCL(Supervised Prototypeal Contrastive Learning)の損失を提案する。
授業間距離に基づく難易度測定関数を設計し、極端なサンプルの影響を軽減するためのカリキュラム学習を導入する。
3つの広く使用されているベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2022-10-17T03:08:23Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Speech Command Recognition in Computationally Constrained Environments
with a Quadratic Self-organized Operational Layer [92.37382674655942]
軽量ネットワークの音声コマンド認識能力を向上するネットワーク層を提案する。
この手法はテイラー展開と二次形式の概念を借用し、入力層と隠蔽層の両方における特徴のより良い表現を構築する。
このリッチな表現は、Google音声コマンド(GSC)と合成音声コマンド(SSC)データセットに関する広範な実験で示されているように、認識精度の向上をもたらす。
論文 参考訳(メタデータ) (2020-11-23T14:40:18Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。