Fugu-MT 論文翻訳(概要): SELF-EMO: Emotional Self-Evolution from Recognition to Consistent Expression

論文の概要: SELF-EMO: Emotional Self-Evolution from Recognition to Consistent Expression

arxiv url: http://arxiv.org/abs/2604.18003v1
Date: Mon, 20 Apr 2026 09:27:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-21 21:52:52.789438
Title: SELF-EMO: Emotional Self-Evolution from Recognition to Consistent Expression
Title（参考訳）: SELF-EMO: 認識から一貫性表現への感情的自己進化
Authors: Shaowei Zhang, Faqiang Qian, Yan Chen, Ziliang Wang, Kang An, Yong Dai, Mengya Gao, Yichao Wu,
Abstract要約: より優れた感情予測がより一貫性のある感情応答をもたらすという仮説に基づく自己進化フレームワークであるSELF-EMOを提案する。本稿では、感情理解と感情表現という2つの補助的タスクを導入し、モデルが感情認識と対話応答の両方として機能するロールベースのセルフプレイパラダイムを設計する。 IEMOCAP、MELD、エモリーNLPの実験により、SELF-EMOは最先端の性能を達成し、Qwen3-4Bでは+6.33%、Qwen3-8Bでは+8.54%の精度が向上した。
参考スコア（独自算出の注目度）: 13.896538941019722
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Emotion Recognition in Conversation (ERC) has become a fundamental capability for large language models (LLMs) in human-centric interaction. Beyond accurate recognition, coherent emotional expression is also crucial, yet both are limited by the scarcity and static nature of high-quality annotated data. In this work, we propose SELF-EMO, a self-evolution framework grounded in the hypothesis that better emotion prediction leads to more consistent emotional responses. We introduce two auxiliary tasks, emotional understanding and emotional expression, and design a role-based self-play paradigm where the model acts as both an emotion recognizer and a dialogue responder. Through iterative interactions, the model generates diverse conversational trajectories, enabling scalable data generation. To ensure quality, we adopt a data flywheel mechanism that filters candidate predictions and responses using a smoothed IoU-based reward and feeds selected samples back for continuous self-improvement without external supervision. We further develop SELF-GRPO, a reinforcement learning algorithm that stabilizes optimization with multi-label alignment rewards and group-level consistency signals. Experiments on IEMOCAP, MELD, and EmoryNLP show that SELF-EMO achieves state-of-the-art performance, improving accuracy by +6.33% on Qwen3-4B and +8.54% on Qwen3-8B, demonstrating strong effectiveness and generalization.
Abstract（参考訳）: Emotion Recognition in Conversation (ERC) は、人間中心の対話において、大きな言語モデル(LLM)の基本的な機能となっている。正確な認識以外にも、コヒーレントな感情表現もまた重要であるが、どちらも高品質な注釈付きデータの不足と静的な性質によって制限されている。本研究では,より優れた感情予測がより一貫性のある感情応答をもたらすという仮説に基づく自己進化フレームワークであるSELF-EMOを提案する。本稿では、感情理解と感情表現という2つの補助的タスクを導入し、モデルが感情認識と対話応答の両方として機能するロールベースのセルフプレイパラダイムを設計する。反復的相互作用により、モデルは多様な対話軌跡を生成し、スケーラブルなデータ生成を可能にする。品質を確保するために、スムーズなIoUベースの報酬を用いて候補予測と応答をフィルタリングするデータフライホイール機構を採用し、外部の監視なしに、選択したサンプルをフィードバックして継続的な自己改善を行う。さらに,多ラベルアライメント報酬とグループレベルの整合性信号を用いて最適化を安定化する強化学習アルゴリズムSELF-GRPOを開発した。 IEMOCAP、MELD、エモリーNLPの実験では、SELF-EMOは最先端の性能を達成し、Qwen3-4Bでは+6.33%、Qwen3-8Bでは+8.54%の精度向上を実現し、高い効果と一般化を示した。

関連論文リスト

E^2-LLM: Bridging Neural Signals and Interpretable Affective Analysis [54.763420895859035]
脳波からの感情分析のための最初のMLLMフレームワークであるELLM2-EEG-to-Emotion Large Language Modelを提案する。 ELLMは学習可能なプロジェクション層を通じて、トレーニング済みのEEGエンコーダとQベースのLLMを統合し、マルチステージのトレーニングパイプラインを使用する。 7つの感情カテゴリーにまたがるデータセット実験により, ELLM2-EEG-to-Emotion Large Language Modelは感情分類において優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2026-01-11T13:21:20Z)
A Unified Spoken Language Model with Injected Emotional-Attribution Thinking for Human-like Interaction [50.05919688888947]
本稿では,感情的インテリジェンスのための統一言語モデルを提案する。 IEATは、ユーザーの感情状態とその根本原因をモデルの内部推論プロセスに組み込んでおり、明示的な監督として扱われるのではなく、感情を意識した推論を内部化することができる。 HumDial(Human-like Spoken Dialogue Systems Challenge)Emotional Intelligenceベンチマークの実験は、提案手法が感情軌道モデリング、感情的推論、共感的応答生成にまたがるトップランクのパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (2026-01-08T14:07:30Z)
Emotion-Coherent Reasoning for Multimodal LLMs via Emotional Rationale Verifier [53.55996102181836]
本稿では,感情関係検証器 (ERV) と説明リワードを提案する。本手法は,対象感情と明確に一致した推論をモデルに導出する。我々のアプローチは、説明と予測の整合性を高めるだけでなく、MLLMが感情的に一貫性があり、信頼できる対話を実現するのにも役立ちます。
論文参考訳（メタデータ） (2025-10-27T16:40:17Z)
EmoPerso: Enhancing Personality Detection with Self-Supervised Emotion-Aware Modelling [22.309957211042597]
テキストからの個人性検出は、ユーザーのソーシャルメディア投稿を分析して行うのが一般的である。本稿では,感情認識モデルによる人格検出を改善する自己教師型フレームワークであるEmoPersoを提案する。
論文参考訳（メタデータ） (2025-09-02T15:57:26Z)
RLVER: Reinforcement Learning with Verifiable Emotion Rewards for Empathetic Agents [67.46032287312339]
大規模言語モデル(LLM)は論理的およびアルゴリズム的推論において優れているが、彼らの感情的知性(EQ)は認知能力よりもはるかに遅れている。シミュレーションユーザによる検証可能な感情報酬を活用する,最初のエンドツーエンド強化学習フレームワークであるRLVERを紹介する。以上の結果から,RLVERは感情的知的で幅広い言語エージェントへの実践的な経路であることが示唆された。
論文参考訳（メタデータ） (2025-07-03T18:33:18Z)
Self-supervised Gait-based Emotion Representation Learning from Selective Strongly Augmented Skeleton Sequences [4.740624855896404]
自己教師型歩行に基づく感情表現のための選択的強強化を利用したコントラスト学習フレームワークを提案する。提案手法はEmotion-Gait (E-Gait) と Emilya のデータセットで検証され, 異なる評価プロトコル下での最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-05-08T09:13:10Z)
EmotionIC: emotional inertia and contagion-driven dependency modeling for emotion recognition in conversation [34.24557248359872]
本稿では,ERCタスクに対する感情的慣性・伝染型依存性モデリング手法(EmotionIC)を提案する。 EmotionICは3つの主要コンポーネント、すなわちIDマスク付きマルチヘッド注意(IMMHA)、対話型Gated Recurrent Unit(DiaGRU)、Skip-chain Conditional Random Field(SkipCRF)から構成されている。実験結果から,提案手法は4つのベンチマークデータセットにおいて,最先端のモデルよりも大幅に優れていることが示された。
論文参考訳（メタデータ） (2023-03-20T13:58:35Z)
A Hierarchical Regression Chain Framework for Affective Vocal Burst Recognition [72.36055502078193]
本稿では,声帯からの感情認識のための連鎖回帰モデルに基づく階層的枠組みを提案する。データスパシティの課題に対処するため、レイヤワイドおよび時間アグリゲーションモジュールを備えた自己教師付き学習(SSL)表現も使用しています。提案されたシステムは、ACII Affective Vocal Burst (A-VB) Challenge 2022に参加し、「TWO」および「CULTURE」タスクで第1位となった。
論文参考訳（メタデータ） (2023-03-14T16:08:45Z)
Multimodal Emotion Recognition using Transfer Learning from Speaker Recognition and BERT-based models [53.31917090073727]
本稿では,音声とテキストのモダリティから,伝達学習モデルと微調整モデルとを融合したニューラルネットワークによる感情認識フレームワークを提案する。本稿では,対話型感情的モーションキャプチャー・データセットにおけるマルチモーダル・アプローチの有効性を評価する。
論文参考訳（メタデータ） (2022-02-16T00:23:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。