論文の概要: Do LLMs "Feel"? Emotion Circuits Discovery and Control
- arxiv url: http://arxiv.org/abs/2510.11328v1
- Date: Mon, 13 Oct 2025 12:24:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.354548
- Title: Do LLMs "Feel"? Emotion Circuits Discovery and Control
- Title(参考訳): LLMは「フィール」か? 感情回路の発見と制御
- Authors: Chenxi Wang, Yixuan Zhang, Ruiji Yu, Yufei Zheng, Lang Gao, Zirui Song, Zixiang Xu, Gus Xia, Huishuai Zhang, Dongyan Zhao, Xiuying Chen,
- Abstract要約: 本研究では、感情表現を引き起こす内部メカニズムと、生成したテキストにおける感情の制御について検討する。
これは、大きな言語モデルで感情回路を発見し、検証する最初の体系的な研究である。
- 参考スコア(独自算出の注目度): 54.57583855608979
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As the demand for emotional intelligence in large language models (LLMs) grows, a key challenge lies in understanding the internal mechanisms that give rise to emotional expression and in controlling emotions in generated text. This study addresses three core questions: (1) Do LLMs contain context-agnostic mechanisms shaping emotional expression? (2) What form do these mechanisms take? (3) Can they be harnessed for universal emotion control? We first construct a controlled dataset, SEV (Scenario-Event with Valence), to elicit comparable internal states across emotions. Subsequently, we extract context-agnostic emotion directions that reveal consistent, cross-context encoding of emotion (Q1). We identify neurons and attention heads that locally implement emotional computation through analytical decomposition and causal analysis, and validate their causal roles via ablation and enhancement interventions. Next, we quantify each sublayer's causal influence on the model's final emotion representation and integrate the identified local components into coherent global emotion circuits that drive emotional expression (Q2). Directly modulating these circuits achieves 99.65% emotion-expression accuracy on the test set, surpassing prompting- and steering-based methods (Q3). To our knowledge, this is the first systematic study to uncover and validate emotion circuits in LLMs, offering new insights into interpretability and controllable emotional intelligence.
- Abstract(参考訳): 大きな言語モデル(LLM)における感情知性の需要が増大するにつれて、感情表現を引き起こす内部メカニズムの理解と、生成されたテキストにおける感情の制御が大きな課題となっている。
1)LLMは感情表現を形成する文脈に依存しないメカニズムを含んでいるか?
2) これらのメカニズムはどのような形をとるのか?
(3)普遍的な感情制御に利用できるか?
まず、制御されたデータセットであるSEV(Scenario-Event with Valence)を構築し、感情間で比較可能な内部状態を抽出します。
その後,文脈に依存しない感情方向を抽出し,感情の一貫したテキスト間符号化を明らかにする(Q1)。
解析的分解と因果解析を通じて感情計算を局所的に実施するニューロンと注意頭を特定し,その因果的役割をアブレーションとエンハンスメントの介入によって検証する。
次に、各サブレイヤの因果関係がモデルの最終感情表現に与える影響を定量化し、同定された局所成分を感情表現を駆動するコヒーレントなグローバル感情回路に統合する(Q2)。
これらの回路を直接変調することで、テストセット上で99.65%の感情表現精度が達成され、プロンプトとステアリングに基づく方法(Q3)を上回る。
我々の知る限り、これはLLMの感情回路を発見し、検証する最初の体系的な研究であり、解釈可能性と制御可能な感情知性に関する新たな洞察を提供する。
関連論文リスト
- AI shares emotion with humans across languages and cultures [12.530921452568291]
言語文化グループとモデル家族間の人間とAIの感情的アライメントを評価する。
分析の結果,LLM由来の感情空間は人間の知覚と構造的に一致していることがわかった。
モデル表現は、異なる感情カテゴリーにまたがって安定かつ自然に調節可能であることを示す。
論文 参考訳(メタデータ) (2025-06-11T14:42:30Z) - UDDETTS: Unifying Discrete and Dimensional Emotions for Controllable Emotional Text-to-Speech [61.989360995528905]
制御可能な感情的TTSのための離散的感情と次元的感情を統一する普遍的なフレームワークであるUDDETTSを提案する。
このモデルは、次元的感情記述のための解釈可能なArousal-Dominance-Valence(ADV)空間を導入し、離散的な感情ラベルまたは非線形に定量化されたADV値によって駆動される感情制御をサポートする。
実験の結果, UDDETTSは3次元の線形感情制御を実現し, エンドツーエンドの感情音声合成能力に優れていた。
論文 参考訳(メタデータ) (2025-05-15T12:57:19Z) - AI with Emotions: Exploring Emotional Expressions in Large Language Models [0.0]
大きな言語モデル(LLM)は、特定の感情状態で質問に答えるエージェントとしてロールプレイを行う。
ラッセルの「サイクムプレックス」モデルは、眠気(覚醒)と快楽(静寂)の軸に沿った感情を特徴づける。
評価の結果, 生成した回答の感情状態は, 仕様と一致していた。
論文 参考訳(メタデータ) (2025-04-20T18:49:25Z) - Think out Loud: Emotion Deducing Explanation in Dialogues [57.90554323226896]
対話における感情推論(Emotion Deducing Explanation in Dialogues)を提案する。
EDENは感情と原因を明確な考え方で認識する。
大規模言語モデル(LLM)が感情や原因をよりよく認識するのに役立ちます。
論文 参考訳(メタデータ) (2024-06-07T08:58:29Z) - ECR-Chain: Advancing Generative Language Models to Better Emotion-Cause Reasoners through Reasoning Chains [61.50113532215864]
CEE(Causal Emotion Entailment)は、ターゲット発話で表現される感情を刺激する会話における因果発話を特定することを目的としている。
CEEにおける現在の研究は、主に会話のセマンティックな相互作用と感情的な相互作用をモデル化することに焦点を当てている。
本研究では,会話中の感情表現から刺激を推測するために,ステップバイステップの推論手法である感情・因果関係(ECR-Chain)を導入する。
論文 参考訳(メタデータ) (2024-05-17T15:45:08Z) - CTSM: Combining Trait and State Emotions for Empathetic Response Model [2.865464162057812]
共感応答生成は、対話システムに話者の感情を知覚し、それに応じて共感応答を生成する。
我々は,共感反応モデル(CTSM)のためのトラストと状態感情の組み合わせを提案する。
対話における感情を十分に知覚するために、まず特徴と状態の感情の埋め込みを構築し、エンコードする。
感情表現を誘導する感情誘導モジュールにより、感情知覚能力をさらに強化する。
論文 参考訳(メタデータ) (2024-03-22T10:45:13Z) - Enhancing Emotional Generation Capability of Large Language Models via Emotional Chain-of-Thought [50.13429055093534]
大規模言語モデル(LLM)は様々な感情認識タスクにおいて顕著な性能を示した。
本研究では,感情生成タスクにおけるLLMの性能を高めるための感情連鎖(ECoT)を提案する。
論文 参考訳(メタデータ) (2024-01-12T16:42:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。