論文の概要: Leading the Follower: Learning Persuasive Agents in Social Deduction Games
- arxiv url: http://arxiv.org/abs/2510.09087v1
- Date: Fri, 10 Oct 2025 07:33:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.31277
- Title: Leading the Follower: Learning Persuasive Agents in Social Deduction Games
- Title(参考訳): ソーシャル・ドダクション・ゲームにおける説得的エージェントの学習
- Authors: Zhang Zheng, Deheng Ye, Peilin Zhao, Hao Wang,
- Abstract要約: 大規模言語モデル(LLM)エージェントは、社会的推論ゲームにおいて顕著な進歩を見せている。
エージェントに説得力のある影響に対する発話を最適化するよう訓練する強化学習フレームワークを提案する。
この研究は、戦略的社会的影響力を持つAIエージェントを開発するための重要なステップである。
- 参考スコア(独自算出の注目度): 41.77995385351868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language model (LLM) agents have shown remarkable progress in social deduction games (SDGs). However, existing approaches primarily focus on information processing and strategy selection, overlooking the significance of persuasive communication in influencing other players' beliefs and responses. In SDGs, success depends not only on making correct deductions but on convincing others to response in alignment with one's intent. To address this limitation, we formalize turn-based dialogue in SDGs as a Stackelberg competition, where the current player acts as the leader who strategically influences the follower's response. Building on this theoretical foundation, we propose a reinforcement learning framework that trains agents to optimize utterances for persuasive impact. Through comprehensive experiments across three diverse SDGs, we demonstrate that our agents significantly outperform baselines. This work represents a significant step toward developing AI agents capable of strategic social influence, with implications extending to scenarios requiring persuasive communication.
- Abstract(参考訳): 大規模言語モデル (LLM) エージェントは社会的推論ゲーム (SDG) において顕著な進歩を見せている。
しかし、既存のアプローチは情報処理と戦略選択に重点を置いており、他のプレイヤーの信念や反応に影響を与える説得力のあるコミュニケーションの重要性を見越している。
SDGでは、成功は正しい推論を行うだけでなく、他人の意図に合わせて反応するよう説得することに依存する。
この制限に対処するため、SDGのターンベースの対話をスタックルバーグ競技として形式化し、現在のプレイヤーがフォロワーの反応に戦略的に影響を及ぼすリーダーとして機能する。
この理論の基礎の上に構築された強化学習フレームワークは、エージェントに説得力のある影響に対する発話を最適化するよう訓練する。
3種類のSDGの総合的な実験を通して、我々のエージェントはベースラインを大幅に上回っていることを実証した。
この研究は、戦略的社会的影響力を持つAIエージェントを開発するための重要なステップであり、説得力のあるコミュニケーションを必要とするシナリオにまで拡張されている。
関連論文リスト
- From Simulation to Strategy: Automating Personalized Interaction Planning for Conversational Agents [17.59366879306331]
本研究は、年齢、性別、職業にまたがるユーザプロファイルに基づいて、その対話を適応させる営業指向のエージェントについて検討する。
我々は,エージェントがユーザの好みに合わせた意図を優先するように誘導する,軽量で職業条件付き戦略を導入する。
論文 参考訳(メタデータ) (2025-10-08T09:12:33Z) - Towards Strategic Persuasion with Language Models [23.7697785759693]
大規模言語モデル(LLM)は、人間のものと同等の強い説得能力を示している。
LLMの説得能力を測定するためのスケーラブルで原則化されたフレームワークを提供するために、理論駆動のアプローチを採用する。
論文 参考訳(メタデータ) (2025-09-26T23:00:15Z) - Anticipating Gaming to Incentivize Improvement: Guiding Agents in (Fair) Strategic Classification [6.660458629649826]
アルゴリズムを騙そうとする個人の選択(「改善」)について検討する。
それらのインタラクションをStackelbergのゲームとして定式化し、そこで企業は(フェア)分類器をデプロイし、個人は戦略的に応答する。
論文 参考訳(メタデータ) (2025-05-08T18:47:23Z) - Playpen: An Environment for Exploring Learning Through Conversational Interaction [84.0413820245725]
本研究は,対話ゲームが学習のフィードバック信号の源として機能するかどうかを考察する。
本稿では,対話ゲームによるオフラインおよびオンライン学習環境であるPlaypenを紹介する。
SFTによる模倣学習は、目に見えないインスタンスのパフォーマンスを向上させるが、他のスキルに悪影響を及ぼす。
論文 参考訳(メタデータ) (2025-04-11T14:49:33Z) - Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - AgentSense: Benchmarking Social Intelligence of Language Agents through Interactive Scenarios [38.878966229688054]
本稿では,対話型シナリオを通して言語エージェントのソーシャルインテリジェンスをベンチマークするAgensSenseを紹介する。
ドラマティック理論に基づいて、エージェントセンスは、広範なスクリプトから構築された1,225の多様な社会的シナリオを作成するためにボトムアップアプローチを採用している。
我々はERG理論を用いて目標を分析し、包括的な実験を行う。
以上の結果から,LPMは複雑な社会シナリオ,特に高レベルの成長ニーズにおいて,目標達成に苦慮していることが明らかとなった。
論文 参考訳(メタデータ) (2024-10-25T07:04:16Z) - The Future of Cognitive Strategy-enhanced Persuasive Dialogue Agents:
New Perspectives and Trends [23.68567141617251]
我々は、いくつかの基本的な認知心理学理論を提示し、3つの典型的な認知戦略の形式化された定義を与える。
本稿では,CogAgentの基盤となる形式的定義を取り入れた新しいシステムアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-02-07T07:28:34Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - Examining the Ordering of Rhetorical Strategies in Persuasive Requests [58.63432866432461]
本研究では,大規模ローン要求コーパスからのテキスト要求において,コンテンツと修辞戦略をアンタングル化するために,変分オートエンコーダモデルを用いる。
特定の(順序の)戦略が要求の内容と一意に相互作用し、成功率に影響を与え、その結果、要求の説得力に影響を及ぼす。
論文 参考訳(メタデータ) (2020-10-09T15:10:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。