論文の概要: Conversations: Love Them, Hate Them, Steer Them
- arxiv url: http://arxiv.org/abs/2505.17413v1
- Date: Fri, 23 May 2025 02:58:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.779934
- Title: Conversations: Love Them, Hate Them, Steer Them
- Title(参考訳): 会話:愛のテーマ、憎しみのテーマ、ステア・テーマ
- Authors: Niranjan Chebrolu, Gerard Christopher Yeo, Kokil Jaidka,
- Abstract要約: 大きな言語モデル (LLMs) は会話の流布を増大させるが、人間のようなニュアンスな感情表現でそれらを注入することは大きな課題である。
本稿では,LLaMA 3.1-8Bにより,より人間らしく感情的なニュアンスを示すことができることを示す。
- 参考スコア(独自算出の注目度): 10.014248704653
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) demonstrate increasing conversational fluency, yet instilling them with nuanced, human-like emotional expression remains a significant challenge. Current alignment techniques often address surface-level output or require extensive fine-tuning. This paper demonstrates that targeted activation engineering can steer LLaMA 3.1-8B to exhibit more human-like emotional nuances. We first employ attribution patching to identify causally influential components, to find a key intervention locus by observing activation patterns during diagnostic conversational tasks. We then derive emotional expression vectors from the difference in the activations generated by contrastive text pairs (positive vs. negative examples of target emotions). Applying these vectors to new conversational prompts significantly enhances emotional characteristics: steered responses show increased positive sentiment (e.g., joy, trust) and more frequent first-person pronoun usage, indicative of greater personal engagement. Our findings offer a precise and interpretable method for controlling specific emotional attributes in LLMs, contributing to developing more aligned and empathetic conversational AI.
- Abstract(参考訳): 大きな言語モデル (LLMs) は会話の流布を増大させるが、人間のようなニュアンスな感情表現でそれらを注入することは大きな課題である。
現在のアライメント技術は、しばしば表面レベルの出力に対処するか、広範囲の微調整を必要とする。
本稿では,LLaMA 3.1-8Bにより,より人間らしく感情的なニュアンスを示すことができることを示す。
まず属性パッチを用いて因果関係に影響を及ぼす成分を同定し, 対話タスク中のアクティベーションパターンを観察し, 重要な介入点を見つける。
次に、対照的なテキストペアによって生成されるアクティベーションの差から感情表現ベクトルを導出する(対象感情の正対負の例)。
これらのベクトルを新しい会話のプロンプトに適用すると、感情的特性が著しく向上する: ステアリングされた反応は、ポジティブな感情(例えば、喜び、信頼)が増加し、より頻繁な一人称代名詞の使用が増加し、より個人的エンゲージメントが増すことを示している。
我々の研究は、LLMの特定の感情特性を制御するための正確かつ解釈可能な方法を提供し、より整合的で共感的な会話型AIの開発に寄与する。
関連論文リスト
- AER-LLM: Ambiguity-aware Emotion Recognition Leveraging Large Language Models [18.482881562645264]
この研究は、あいまいな感情を認識する上でのLarge Language Models(LLM)の可能性を探究する最初のものである。
我々はゼロショットと少数ショットのプロンプトを設計し、過去の対話を曖昧な感情認識のための文脈情報として組み込んだ。
論文 参考訳(メタデータ) (2024-09-26T23:25:21Z) - Recognizing Emotion Regulation Strategies from Human Behavior with Large Language Models [44.015651538470856]
人間の感情は直接表現されないことが多いが、内部のプロセスや社会的表示規則に従って制御される。
ユーザ間のシナリオで異なる感情制御戦略を自動的に分類する方法は存在しない。
我々は最近導入されたtextscDeepコーパスを利用して、感情の恥の社会的表示をモデル化する。
微調整されたLlama2-7Bモデルは、利用した感情制御戦略を高精度に分類することができる。
論文 参考訳(メタデータ) (2024-08-08T12:47:10Z) - ECR-Chain: Advancing Generative Language Models to Better Emotion-Cause Reasoners through Reasoning Chains [61.50113532215864]
CEE(Causal Emotion Entailment)は、ターゲット発話で表現される感情を刺激する会話における因果発話を特定することを目的としている。
CEEにおける現在の研究は、主に会話のセマンティックな相互作用と感情的な相互作用をモデル化することに焦点を当てている。
本研究では,会話中の感情表現から刺激を推測するために,ステップバイステップの推論手法である感情・因果関係(ECR-Chain)を導入する。
論文 参考訳(メタデータ) (2024-05-17T15:45:08Z) - Dynamic Causal Disentanglement Model for Dialogue Emotion Detection [77.96255121683011]
隠れ変数分離に基づく動的因果解離モデルを提案する。
このモデルは、対話の内容を効果的に分解し、感情の時間的蓄積を調べる。
具体的には,発話と隠れ変数の伝搬を推定する動的時間的ゆがみモデルを提案する。
論文 参考訳(メタデータ) (2023-09-13T12:58:09Z) - Large Language Models Understand and Can be Enhanced by Emotional
Stimuli [53.53886609012119]
我々は、感情的な刺激を理解するために、大規模言語モデルの能力を探究する第一歩を踏み出す。
実験の結果,LLMは感情的知能を把握でき,その性能は感情的刺激によって改善できることがわかった。
EmotionPromptが生成タスクの性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2023-07-14T00:57:12Z) - Emotion Recognition from Multiple Modalities: Fundamentals and
Methodologies [106.62835060095532]
マルチモーダル感情認識(MER)のいくつかの重要な側面について論じる。
まず、広く使われている感情表現モデルと感情モダリティの簡単な紹介から始める。
次に、既存の感情アノテーション戦略とそれに対応する計算タスクを要約する。
最後に,実世界のアプリケーションについて概説し,今後の方向性について論じる。
論文 参考訳(メタデータ) (2021-08-18T21:55:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。