論文の概要: EvoEmo: Towards Evolved Emotional Policies for Adversarial LLM Agents in Multi-Turn Price Negotiation
- arxiv url: http://arxiv.org/abs/2509.04310v3
- Date: Mon, 13 Oct 2025 16:04:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 20:23:38.892486
- Title: EvoEmo: Towards Evolved Emotional Policies for Adversarial LLM Agents in Multi-Turn Price Negotiation
- Title(参考訳): EvoEmo:マルチターン価格ネゴシエーションにおける敵対的LDMエージェントに対する感情政策の展開
- Authors: Yunbo Long, Liming Xu, Lukas Beckenbauer, Yuhan Liu, Alexandra Brintrup,
- Abstract要約: 既存のLarge Language Models (LLM)エージェントは、そのような交渉における感情の機能的役割をほとんど見落としている。
本稿では,交渉における動的感情表現を最適化する進化的強化学習フレームワークであるEvoEmoを紹介する。
- 参考スコア(独自算出の注目度): 61.627248012799704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent research on Chain-of-Thought (CoT) reasoning in Large Language Models (LLMs) has demonstrated that agents can engage in \textit{complex}, \textit{multi-turn} negotiations, opening new avenues for agentic AI. However, existing LLM agents largely overlook the functional role of emotions in such negotiations, instead generating passive, preference-driven emotional responses that make them vulnerable to manipulation and strategic exploitation by adversarial counterparts. To address this gap, we present EvoEmo, an evolutionary reinforcement learning framework that optimizes dynamic emotional expression in negotiations. EvoEmo models emotional state transitions as a Markov Decision Process and employs population-based genetic optimization to evolve high-reward emotion policies across diverse negotiation scenarios. We further propose an evaluation framework with two baselines -- vanilla strategies and fixed-emotion strategies -- for benchmarking emotion-aware negotiation. Extensive experiments and ablation studies show that EvoEmo consistently outperforms both baselines, achieving higher success rates, higher efficiency, and increased buyer savings. This findings highlight the importance of adaptive emotional expression in enabling more effective LLM agents for multi-turn negotiation.
- Abstract(参考訳): 大規模言語モデル (LLMs) におけるChain-of-Thought (CoT) 推論に関する最近の研究は、エージェントが \textit{complex}, \textit{multi-turn} 交渉に従事し、エージェントAIの新しい道を開くことを実証している。
しかし、既存のLLMエージェントは、そのような交渉における感情の機能的役割を概ね見落とし、代わりに、敵による操作や戦略的搾取に対して脆弱な、受動的で好意的な感情的反応を発生させる。
このギャップに対処するため,交渉における動的感情表現を最適化する進化的強化学習フレームワークであるEvoEmoを提案する。
EvoEmoはマルコフ決定プロセスとして感情状態遷移をモデル化し、人口ベースの遺伝的最適化を用いて、多様な交渉シナリオをまたいだハイリワード感情ポリシーを進化させる。
さらに、感情認識交渉のベンチマークを行うための2つの基盤となるバニラ戦略と固定感情戦略を用いた評価フレームワークを提案する。
大規模な実験とアブレーション研究により、EvoEmoはベースラインの両方を一貫して上回り、成功率の向上、効率の向上、購入者の貯蓄の増加を実現している。
本研究は,マルチターン交渉において,より効果的なLLMエージェントを実現する上で,適応的感情表現の重要性を強調した。
関連論文リスト
- MERIT Feedback Elicits Better Bargaining in LLM Negotiators [38.1466669265123]
AgoraBenchは、9つの困難な設定にまたがる新しいベンチマークである。
これは、エージェントユーティリティ、交渉力、および交渉が人間の好みとどの程度うまく一致しているかを暗黙的に測定する買収比率を介して運用される。
我々のメカニズムは交渉性能を大幅に改善し、より深い戦略行動とより強力な敵意識をもたらす。
論文 参考訳(メタデータ) (2026-02-11T03:09:45Z) - A Unified Spoken Language Model with Injected Emotional-Attribution Thinking for Human-like Interaction [50.05919688888947]
本稿では,感情的インテリジェンスのための統一言語モデルを提案する。
IEATは、ユーザーの感情状態とその根本原因をモデルの内部推論プロセスに組み込んでおり、明示的な監督として扱われるのではなく、感情を意識した推論を内部化することができる。
HumDial(Human-like Spoken Dialogue Systems Challenge)Emotional Intelligenceベンチマークの実験は、提案手法が感情軌道モデリング、感情的推論、共感的応答生成にまたがるトップランクのパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2026-01-08T14:07:30Z) - How Far Can LLMs Emulate Human Behavior?: A Strategic Analysis via the Buy-and-Sell Negotiation Game [0.8353024005684598]
大規模言語モデル(LLM)の人間の感情的・行動的模倣と戦略的意思決定能力を定量的に評価する手法を提案する。
具体的には、複数のLLMに異なるペルソナを割り当て、バイヤーとセラーの交渉を行い、勝利率、取引価格、SHAP値などの結果を包括的に分析する。
実験の結果,既存のベンチマークスコアが高いモデルでは,全体の交渉性能が向上することが示された。
論文 参考訳(メタデータ) (2025-11-22T09:07:29Z) - Affective Multimodal Agents with Proactive Knowledge Grounding for Emotionally Aligned Marketing Dialogue [3.780355670921318]
AffectMindは、感情的アライメントと説得的相互作用を維持するために、積極的な推論と動的知識を基礎とする多モーダル感情対話エージェントである。
実験の結果,AffectMindは感情的一貫性,説得的成功率,長期ユーザエンゲージメントにおいて,強いLCMベースラインを上回っていることがわかった。
論文 参考訳(メタデータ) (2025-11-21T04:16:45Z) - EQ-Negotiator: Dynamic Emotional Personas Empower Small Language Models for Edge-Deployable Credit Negotiation [66.09161596959771]
小型言語モデル (SLM) は実用的な代替手段を提供するが、大規模言語モデル (LLM) と比較して大きな性能差がある。
本稿では,感情的ペルソナを用いて,この能力ギャップを橋渡しする新しいフレームワークであるEQ-Negotiatorを紹介する。
EQ-Negotiator を用いた 7B パラメータ言語モデルは,ベースライン LLM の 10 倍以上の大きさで,債務回復と交渉効率が向上することを示す。
論文 参考訳(メタデータ) (2025-11-05T11:25:07Z) - EQ-Negotiator: An Emotion-Reasoning LLM Agent in Credit Dialogues [16.057203527513632]
本稿では,事前学習した言語モデルからの感情知覚とゲーム理論と隠れマルコフモデルに基づく感情推論を組み合わせたEQ-negotiatorを提案する。
クライアントの現在の感情と過去の感情の両方を考慮して、インタラクション中の否定的な感情を管理し、対処する。
論文 参考訳(メタデータ) (2025-03-27T01:41:34Z) - EPO: Explicit Policy Optimization for Strategic Reasoning in LLMs via Reinforcement Learning [69.55982246413046]
戦略的推論のための明示的なポリシー最適化(EPO)を提案する。
我々は,マルチターン強化学習(RL)による戦略的推論モデルを訓練し,プロセス報酬と反復的な自己プレイを活用する。
本研究は, EPOに出現する様々な協調的推論機構と, 新規戦略の創出における有効性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-18T03:15:55Z) - EmoDynamiX: Emotional Support Dialogue Strategy Prediction by Modelling MiXed Emotions and Discourse Dynamics [12.105216351739422]
EmoDynamiXは、ユーザの微粒な感情と、不均一なグラフを使用してシステム戦略の間の談話ダイナミクスをモデル化し、パフォーマンスと透明性を改善します。
2つのESCデータセットの実験結果から、EmoDynamiXは従来の最先端の手法よりも優れたマージンを持つことが示された。
論文 参考訳(メタデータ) (2024-08-16T14:54:41Z) - Building Emotional Support Chatbots in the Era of LLMs [64.06811786616471]
我々は,Large Language Models (LLMs) の計算能力で人間の洞察を合成する革新的な方法論を導入する。
また,ChatGPTの文脈内学習の可能性を利用して,ExTESと呼ばれる感情支援対話データセットを生成する。
次に、LLaMAモデルに高度なチューニング手法を展開し、多様なトレーニング戦略の影響を検証し、最終的に感情的支援の相互作用に細心の注意を払ってLLMを出力する。
論文 参考訳(メタデータ) (2023-08-17T10:49:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。