論文の概要: EvoEmo: Towards Evolved Emotional Policies for LLM Agents in Multi-Turn Negotiation
- arxiv url: http://arxiv.org/abs/2509.04310v2
- Date: Tue, 09 Sep 2025 02:43:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 12:33:22.806203
- Title: EvoEmo: Towards Evolved Emotional Policies for LLM Agents in Multi-Turn Negotiation
- Title(参考訳): EvoEmo:マルチトゥルンネゴシエーションにおけるLDMエージェントの感情政策の展開
- Authors: Yunbo Long, Liming Xu, Lukas Beckenbauer, Yuhan Liu, Alexandra Brintrup,
- Abstract要約: 既存のLarge Language Models (LLM)エージェントは、そのような交渉における感情の機能的役割をほとんど見落としている。
本稿では,交渉における動的感情表現を最適化する進化的強化学習フレームワークであるEvoEmoを紹介する。
- 参考スコア(独自算出の注目度): 61.627248012799704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent research on Chain-of-Thought (CoT) reasoning in Large Language Models (LLMs) has demonstrated that agents can engage in \textit{complex}, \textit{multi-turn} negotiations, opening new avenues for agentic AI. However, existing LLM agents largely overlook the functional role of emotions in such negotiations, instead generating passive, preference-driven emotional responses that make them vulnerable to manipulation and strategic exploitation by adversarial counterparts. To address this gap, we present EvoEmo, an evolutionary reinforcement learning framework that optimizes dynamic emotional expression in negotiations. EvoEmo models emotional state transitions as a Markov Decision Process and employs population-based genetic optimization to evolve high-reward emotion policies across diverse negotiation scenarios. We further propose an evaluation framework with two baselines -- vanilla strategies and fixed-emotion strategies -- for benchmarking emotion-aware negotiation. Extensive experiments and ablation studies show that EvoEmo consistently outperforms both baselines, achieving higher success rates, higher efficiency, and increased buyer savings. This findings highlight the importance of adaptive emotional expression in enabling more effective LLM agents for multi-turn negotiation.
- Abstract(参考訳): 大規模言語モデル (LLMs) におけるChain-of-Thought (CoT) 推論に関する最近の研究は、エージェントが \textit{complex}, \textit{multi-turn} 交渉に従事し、エージェントAIの新しい道を開くことを実証している。
しかし、既存のLLMエージェントは、そのような交渉における感情の機能的役割を概ね見落とし、代わりに、敵による操作や戦略的搾取に対して脆弱な、受動的で好意的な感情的反応を発生させる。
このギャップに対処するため,交渉における動的感情表現を最適化する進化的強化学習フレームワークであるEvoEmoを提案する。
EvoEmoはマルコフ決定プロセスとして感情状態遷移をモデル化し、人口ベースの遺伝的最適化を用いて、多様な交渉シナリオをまたいだハイリワード感情ポリシーを進化させる。
さらに、感情認識交渉のベンチマークを行うための2つの基盤となるバニラ戦略と固定感情戦略を用いた評価フレームワークを提案する。
大規模な実験とアブレーション研究により、EvoEmoはベースラインの両方を一貫して上回り、成功率の向上、効率の向上、購入者の貯蓄の増加を実現している。
本研究は,マルチターン交渉において,より効果的なLLMエージェントを実現する上で,適応的感情表現の重要性を強調した。
関連論文リスト
- EQ-Negotiator: An Emotion-Reasoning LLM Agent in Credit Dialogues [16.057203527513632]
本稿では,事前学習した言語モデルからの感情知覚とゲーム理論と隠れマルコフモデルに基づく感情推論を組み合わせたEQ-negotiatorを提案する。
クライアントの現在の感情と過去の感情の両方を考慮して、インタラクション中の否定的な感情を管理し、対処する。
論文 参考訳(メタデータ) (2025-03-27T01:41:34Z) - EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-18T03:15:55Z) - EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics [12.105216351739422]
EmoDynamiXは、ユーザの微粒な感情と、不均一なグラフを使用してシステム戦略の間の談話ダイナミクスをモデル化し、パフォーマンスと透明性を改善します。
2つのESCデータセットの実験結果から、EmoDynamiXは従来の最先端の手法よりも優れたマージンを持つことが示された。
論文 参考訳(メタデータ) (2024-08-16T14:54:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。