論文の概要: From Syntax to Emotion: A Mechanistic Analysis of Emotion Inference in LLMs
- arxiv url: http://arxiv.org/abs/2604.25866v1
- Date: Tue, 28 Apr 2026 17:03:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.970445
- Title: From Syntax to Emotion: A Mechanistic Analysis of Emotion Inference in LLMs
- Title(参考訳): 構文から感情へ:LLMにおける感情推論の力学解析
- Authors: Bangzhao Shu, Arinjay Singh, Mai ElSherief,
- Abstract要約: 大規模言語モデル(LLM)における感情認識の内部メカニズムについて検討する。
層間におけるスパース特徴アクティベーションの解析により,一貫した3相情報フローを同定する。
感情表現は感情間で共有される特徴と感情特有の特徴の両方から構成されることを示す。
- 参考スコア(独自算出の注目度): 1.4692712025142225
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) are increasingly used in emotionally sensitive human-AI applications, yet little is known about how emotion recognition is internally represented. In this work, we investigate the internal mechanisms of emotion recognition in LLMs using sparse autoencoders (SAEs). By analyzing sparse feature activations across layers, we identify a consistent three-phase information flow, in which emotion-related features emerge only in the final phase. We further show that emotion representations comprise both shared features across emotions and emotion-specific features. Using phase-stratified causal tracing, we identify a small set of features that strongly influence emotion predictions, and show that both their number and causal impact vary across emotions; in particular, Disgust is more weakly and diffusely represented than other emotions. Finally, we propose an interpretable and data-efficient causal feature steering method that significantly improves emotion recognition performance across multiple models while largely preserving language modeling ability, and demonstrate that these improvements generalize across multiple emotion recognition datasets. Overall, our findings provide a systematic analysis of the internal mechanisms underlying emotion recognition in LLMs and introduce an efficient, interpretable, and controllable approach for improving model performance.
- Abstract(参考訳): 大きな言語モデル(LLM)は、感情に敏感な人間-AIアプリケーションにますます使われていますが、感情認識が内部的にどのように表現されているかはほとんど分かっていません。
本研究では, スパースオートエンコーダ (SAE) を用いたLLMにおける感情認識機構について検討した。
層間におけるスパース特徴アクティベーションの解析により,最終段階のみに感情関連特徴が出現する3相情報フローを一貫した情報フローとして同定する。
さらに、感情表現は、感情間の共有特徴と感情特有の特徴の両方から構成されていることを示す。
位相階層化された因果的追跡を用いて、感情予測に強く影響を及ぼす少数の特徴を同定し、その数と因果的影響が感情によって異なることを示す。
最後に、言語モデリング能力を大きく保ちながら、複数のモデル間での感情認識性能を著しく向上させ、これらの改善が複数の感情認識データセットにまたがって一般化されることを実証する、解釈可能でデータ効率の良い因果的特徴ステアリング手法を提案する。
本研究は,LLMにおける感情認識のメカニズムを体系的に分析し,モデル性能を改善するための効率的かつ解釈可能で制御可能なアプローチを提案する。
関連論文リスト
- How Emotion Shapes the Behavior of LLMs and Agents: A Mechanistic Study [33.5007842598689]
感情信号が大規模言語モデル(LLM)とエージェントの動作を形作ることができるかどうかを検討する。
既存の感情認識研究は、主に感情を表面的なスタイルファクターまたは知覚的ターゲットとして扱う。
直接表現レベルの介入を可能にする解釈可能な感情ステアリングフレームワークであるE-STEERを提案する。
論文 参考訳(メタデータ) (2026-03-09T12:20:02Z) - Memory-guided Prototypical Co-occurrence Learning for Mixed Emotion Recognition [56.00118641432005]
本稿では,感情共起パターンを明示的にモデル化するメモリ誘導型プロトタイプ共起学習フレームワークを提案する。
人間の認知記憶システムに触発されて,意味レベルの共起関係を抽出するメモリ検索戦略を導入する。
本モデルは感情分布予測のための感情情報表現を学習する。
論文 参考訳(メタデータ) (2026-02-24T04:11:25Z) - Emotion-Coherent Reasoning for Multimodal LLMs via Emotional Rationale Verifier [53.55996102181836]
本稿では,感情関係検証器 (ERV) と説明リワードを提案する。
本手法は,対象感情と明確に一致した推論をモデルに導出する。
我々のアプローチは、説明と予測の整合性を高めるだけでなく、MLLMが感情的に一貫性があり、信頼できる対話を実現するのにも役立ちます。
論文 参考訳(メタデータ) (2025-10-27T16:40:17Z) - GatedxLSTM: A Multimodal Affective Computing Approach for Emotion Recognition in Conversations [35.63053777817013]
GatedxLSTMは、会話におけるマルチモーダル感情認識(ERC)モデルである。
話者と会話相手の双方の声と書き起こしを考慮し、感情的なシフトを駆動する最も影響力のある文章を特定する。
4クラスの感情分類において,オープンソース手法間でのSOTA(State-of-the-art)性能を実現する。
論文 参考訳(メタデータ) (2025-03-26T18:46:18Z) - Modelling Emotions in Face-to-Face Setting: The Interplay of Eye-Tracking, Personality, and Temporal Dynamics [1.6029719942799865]
本研究では、視線追跡データ、時間的ダイナミクス、性格特性を統合することで、知覚と知覚の両方の感情の検出を大幅に向上させる方法について述べる。
本研究は,将来の情緒コンピューティングと人間エージェントシステムの設計を示唆するものである。
論文 参考訳(メタデータ) (2025-03-18T13:15:32Z) - MEMO-Bench: A Multiple Benchmark for Text-to-Image and Multimodal Large Language Models on Human Emotion Analysis [53.012111671763776]
そこで本研究では、7,145枚の肖像画からなる総合的なベンチマークであるMEMO-Benchを紹介した。
以上の結果から,既存のT2Iモデルは負のモデルよりも肯定的な感情を生成するのに効果的であることが示唆された。
MLLMは人間の感情の識別と認識に一定の効果を示すが、人間のレベルの正確さには欠ける。
論文 参考訳(メタデータ) (2024-11-18T02:09:48Z) - AER-LLM: Ambiguity-aware Emotion Recognition Leveraging Large Language Models [18.482881562645264]
この研究は、あいまいな感情を認識する上でのLarge Language Models(LLM)の可能性を探究する最初のものである。
我々はゼロショットと少数ショットのプロンプトを設計し、過去の対話を曖昧な感情認識のための文脈情報として組み込んだ。
論文 参考訳(メタデータ) (2024-09-26T23:25:21Z) - Emotion Recognition from Multiple Modalities: Fundamentals and
Methodologies [106.62835060095532]
マルチモーダル感情認識(MER)のいくつかの重要な側面について論じる。
まず、広く使われている感情表現モデルと感情モダリティの簡単な紹介から始める。
次に、既存の感情アノテーション戦略とそれに対応する計算タスクを要約する。
最後に,実世界のアプリケーションについて概説し,今後の方向性について論じる。
論文 参考訳(メタデータ) (2021-08-18T21:55:20Z) - Enhancing Cognitive Models of Emotions with Representation Learning [58.2386408470585]
本稿では,きめ細かな感情の埋め込み表現を生成するための,新しいディープラーニングフレームワークを提案する。
本フレームワークは,コンテキスト型埋め込みエンコーダとマルチヘッド探索モデルを統合する。
本モデルは共感対話データセット上で評価され,32種類の感情を分類する最新結果を示す。
論文 参考訳(メタデータ) (2021-04-20T16:55:15Z) - Emotion pattern detection on facial videos using functional statistics [62.997667081978825]
顔面筋運動の有意なパターンを抽出する機能的ANOVAに基づく手法を提案する。
感情群間の表現に時間的差があるかどうかを関数fテストを用いて判定する。
論文 参考訳(メタデータ) (2021-03-01T08:31:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。