論文の概要: MEDN: Motion-Emotion Feature Decoupling Network for Micro-Expression Recognition
- arxiv url: http://arxiv.org/abs/2604.17899v1
- Date: Mon, 20 Apr 2026 07:19:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.748129
- Title: MEDN: Motion-Emotion Feature Decoupling Network for Micro-Expression Recognition
- Title(参考訳): MEDN:マイクロ圧縮認識のための運動感情特徴デカップリングネットワーク
- Authors: Chenxing Hu, Kun Xie, Qiguang Miao, Ruyi Liu, Quan Wang, Zongkai Yang,
- Abstract要約: 本稿では,マイクロ圧縮認識のための運動感情特徴デカップリングネットワーク(MEDN)を提案する。
動作特徴と感情特徴を別々に抽出するデュアルブランチフレームワークを提案する。
3つのベンチマークデータセットの実験により、MEDNは動作と感情の特徴を効果的に分離し、優れた認識性能を達成することが検証された。
- 参考スコア(独自算出の注目度): 28.87936777678119
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike macro-expression, micro-expression does not follow a strictly consistent mapping rule between emotions and Action Units (AUs). As a result, some micro-expressions share identical AUs yet represent completely opposite emotional categories, making them highly visually similar. Existing microexpression recognition (MER) methods mostly rely on explicit facial motion cues (e.g., optical flow, frame differences, AU features) while ignoring implicit emotion information. To tackle this issue, this paper presents a Motion Emotion Feature Decoupling Network (MEDN) for MER. We design a dual-branch framework to separately extract motion and emotion features. In the motion branch, an AU-detection task restricts features to the explicit motion domain, and orthogonal loss is adopted to reduce motion emotion feature coupling. For implicit emotion modeling, we propose a Sparse Emotion Vision Transformer (SEVit) that sparsifies spatial tokens to highlight local temporal variations with multi-scale sparsity rates. A Collaborative Fusion Module (CoFM) is further developed to fuse disentangled motion and emotion features adaptively. Extensive experiments on three benchmark datasets validate that MEDN effectively decouples motion and emotion features and achieves superior recognition performance, offering a new perspective for enhancing recognition accuracy and generalization.
- Abstract(参考訳): マクロ表現とは異なり、マイクロ表現は感情と行動単位(AU)の間の厳密な一貫したマッピングルールに従わない。
その結果、一部のマイクロ表現は同一のAUを共有しているが、全く反対の感情カテゴリーを表現しており、視覚的に非常に類似している。
既存のマイクロ圧縮認識(MER)法は主に暗黙の感情情報を無視しながら、明示的な顔の動きの手がかり(例えば、光学フロー、フレーム差、AU特徴)に依存している。
本稿では,MERのための運動感情特徴分離ネットワーク(MEDN)を提案する。
動作特徴と感情特徴を別々に抽出するデュアルブランチ・フレームワークを設計する。
動作分岐において、AU検出タスクは、特徴を明示的な動作領域に制限し、運動感情の特徴結合を低減するために直交損失を採用する。
暗黙的感情モデリングのために,空間トークンをスペーシングし,局所時間変動をマルチスケールのスペーシングレートで強調するスパース感情視覚変換器(SEVit)を提案する。
コラボレーティブ・フュージョン・モジュール (CoFM) は、不整合運動と感情特徴を適応的に融合するためにさらに開発されている。
3つのベンチマークデータセットの大規模な実験により、MEDNは動作と感情の特徴を効果的に分離し、認識性能を向上し、認識精度と一般化を向上するための新たな視点を提供する。
関連論文リスト
- Emotion-Director: Bridging Affective Shortcut in Emotion-Oriented Image Generation [23.10502994564729]
Emotion-Directorは2つのモジュールからなるクロスモーダルなコラボレーションフレームワークである。
本稿では,MC拡散(MC-Diffusion)と略されるクロスモーダル協調拡散モデルを提案する。
また,意図した感情を表現するためにテキストプロンプトを書き換えるクロスモーダル協調エージェントMC-Agentを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:32:18Z) - EmoCAST: Emotional Talking Portrait via Emotive Text Description [56.42674612728354]
EmoCASTは、正確なテキスト駆動感情合成のための拡散ベースのフレームワークである。
外観モデリングでは、感情的なプロンプトはテキスト誘導の分離された感情的モジュールを通して統合される。
EmoCASTは、現実的で感情的に表現され、音声同期されたトーキーヘッドビデオを生成する、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-08-28T10:02:06Z) - Emotion Transfer with Enhanced Prototype for Unseen Emotion Recognition in Conversation [64.70874527264543]
会話における未知感情認識(UERC)タスクを初めて紹介する。
本稿では,プロトタイプベースの感情伝達フレームワークProEmoTransを提案する。
ProEmoTransは有望だが、依然として重要な課題に直面している。
論文 参考訳(メタデータ) (2025-08-27T03:16:16Z) - From Coarse to Nuanced: Cross-Modal Alignment of Fine-Grained Linguistic Cues and Visual Salient Regions for Dynamic Emotion Recognition [7.362433184546492]
動的表情認識は、時間的に変化する顔の動きから人間の感情を識別することを目的としている。
本手法は,動的な動作モデリング,意味的テキストの洗練,トークンレベルのクロスモーダルアライメントを統合し,感情的に有意な特徴の正確な局所化を容易にする。
論文 参考訳(メタデータ) (2025-07-16T04:15:06Z) - Disentangle Identity, Cooperate Emotion: Correlation-Aware Emotional Talking Portrait Generation [63.94836524433559]
DICE-Talkは、感情と同一性を切り離し、類似した特徴を持つ感情を協調するフレームワークである。
我々は、モーダル・アテンションを通して、音声と視覚の感情の手がかりを共同でモデル化するアンタングル型感情埋め込み装置を開発した。
次に,学習可能な感情バンクを用いた相関強化感情調和モジュールを提案する。
第3に、拡散過程における感情の一貫性を強制する感情識別目標を設計する。
論文 参考訳(メタデータ) (2025-04-25T05:28:21Z) - GM-TCNet: Gated Multi-scale Temporal Convolutional Network using Emotion
Causality for Speech Emotion Recognition [14.700043991797537]
本稿では,新しい感情的因果表現学習コンポーネントを構築するために,GM-TCNet(Gated Multi-scale Temporal Convolutional Network)を提案する。
GM-TCNetは、時間領域全体の感情のダイナミクスを捉えるために、新しい感情因果表現学習コンポーネントをデプロイする。
我々のモデルは、最先端技術と比較して、ほとんどのケースで最高の性能を維持している。
論文 参考訳(メタデータ) (2022-10-28T02:00:40Z) - MSA-GCN:Multiscale Adaptive Graph Convolution Network for Gait Emotion
Recognition [6.108523790270448]
本稿では,感情認識のためのマルチスケール適応グラフ畳み込みネットワーク(MSA-GCN)を提案する。
本モデルでは, 適応的選択的時空間畳み込みを設計し, コンボリューションカーネルを動的に選択し, 異なる感情のソフト・テンポラルな特徴を得る。
従来の最先端手法と比較して,提案手法は2つの公開データセット上で最高の性能を実現する。
論文 参考訳(メタデータ) (2022-09-19T13:07:16Z) - Shapes of Emotions: Multimodal Emotion Recognition in Conversations via
Emotion Shifts [2.443125107575822]
会話における感情認識(ERC)は重要かつ活発な研究課題である。
最近の研究は、ERCタスクに複数のモダリティを使用することの利点を示している。
マルチモーダルERCモデルを提案し,感情シフト成分で拡張する。
論文 参考訳(メタデータ) (2021-12-03T14:39:04Z) - Emotion Recognition from Multiple Modalities: Fundamentals and
Methodologies [106.62835060095532]
マルチモーダル感情認識(MER)のいくつかの重要な側面について論じる。
まず、広く使われている感情表現モデルと感情モダリティの簡単な紹介から始める。
次に、既存の感情アノテーション戦略とそれに対応する計算タスクを要約する。
最後に,実世界のアプリケーションについて概説し,今後の方向性について論じる。
論文 参考訳(メタデータ) (2021-08-18T21:55:20Z) - Modality-Transferable Emotion Embeddings for Low-Resource Multimodal
Emotion Recognition [55.44502358463217]
本稿では、上記の問題に対処するため、感情を埋め込んだモダリティ変換可能なモデルを提案する。
我々のモデルは感情カテゴリーのほとんどで最先端のパフォーマンスを達成する。
私たちのモデルは、目に見えない感情に対するゼロショットと少数ショットのシナリオにおいて、既存のベースラインよりも優れています。
論文 参考訳(メタデータ) (2020-09-21T06:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。