論文の概要: Learning to Discuss Strategically: A Case Study on One Night Ultimate Werewolf
- arxiv url: http://arxiv.org/abs/2405.19946v2
- Date: Sun, 12 Jan 2025 08:25:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:25:48.639229
- Title: Learning to Discuss Strategically: A Case Study on One Night Ultimate Werewolf
- Title(参考訳): 戦略的に語るための学習: 一夜のアルティメット・ウィールウルフを事例として
- Authors: Xuanfa Jin, Ziyan Wang, Yali Du, Meng Fang, Haifeng Zhang, Jun Wang,
- Abstract要約: One Night Ultimate Werewolf (ONUW) は、プレイヤーが戦略的な議論ポリシーを開発することを要求する。
本稿では、強化学習(RL)によって訓練された議論政策を取り入れたRL命令言語エージェントフレームワークを提案する。
いくつかのONUWゲーム設定実験の結果,提案フレームワークの有効性と一般化性を示した。
- 参考スコア(独自算出の注目度): 28.57358844115881
- License:
- Abstract: Communication is a fundamental aspect of human society, facilitating the exchange of information and beliefs among people. Despite the advancements in large language models (LLMs), recent agents built with these often neglect the control over discussion tactics, which are essential in communication scenarios and games. As a variant of the famous communication game Werewolf, One Night Ultimate Werewolf (ONUW) requires players to develop strategic discussion policies due to the potential role changes that increase the uncertainty and complexity of the game. In this work, we first present the existence of the Perfect Bayesian Equilibria (PBEs) in two scenarios of the ONUW game: one with discussion and one without. The results showcase that the discussion greatly changes players' utilities by affecting their beliefs, emphasizing the significance of discussion tactics. Based on the insights obtained from the analyses, we propose an RL-instructed language agent framework, where a discussion policy trained by reinforcement learning (RL) is employed to determine appropriate discussion tactics to adopt. Our experimental results on several ONUW game settings demonstrate the effectiveness and generalizability of our proposed framework. The project page of our paper: $\href{https://one-night-ultimate-werewolf.github.io}{one-night-ultimate-werewolf.github.io}$.
- Abstract(参考訳): コミュニケーションは人間社会の基本的な側面であり、情報と信念の交換を促進する。
大規模言語モデル(LLM)の進歩にもかかわらず、近年のエージェントは、コミュニケーションシナリオやゲームに不可欠な議論戦術の制御を無視することが多い。
有名なコミュニケーションゲーム『Werewolf』の変種として、One Night Ultimate Werewolf (ONUW) はプレイヤーがゲームの不確実性と複雑さを増大させる潜在的な役割の変化のために戦略的な議論ポリシーを開発することを要求している。
本研究は,ONUWゲームにおける完全ベイズ平衡 (PBE) の存在を2つのシナリオとして提示する。
その結果、議論はプレイヤーの信念に影響を与え、議論戦術の重要性を強調することで、プレイヤーの効用を大きく変えることが明らかとなった。
分析から得られた知見に基づき、強化学習(RL)によって訓練された議論政策を取り入れ、適切な議論手法を採用するためのRL指示言語エージェントフレームワークを提案する。
いくつかのONUWゲーム設定実験の結果,提案フレームワークの有効性と一般化性を示した。
われわれの論文のプロジェクトページ: $\href{https://one-night-ultimate-werewolf.github.io}{one-night-ultimate-werewolf.github.io}$
関連論文リスト
- Verbalized Bayesian Persuasion [54.55974023595722]
情報設計(ID)は、送信者が受信者の最適な振る舞いにどのように影響し、特定の目的を達成するかを探索する。
本研究は,従来のBPを人間の対話を含む現実のゲームに拡張した,ベイズ説得(BP)における言語化フレームワークを提案する。
勧告書,法廷相互作用,法執行機関などの対話シナリオにおける数値実験により,従来のBPの理論的結果の再現と効果的な説得戦略の発見が可能であることを確認した。
論文 参考訳(メタデータ) (2025-02-03T18:20:10Z) - Enhancing Dialogue Generation in Werewolf Game Through Situation Analysis and Persuasion Strategies [1.7725414095035827]
本稿では,LLMをベースとしたWerewolf Game AIを提案する。
様々な説得戦略が採用され、他のプレイヤーを効果的にその行動に合わせるように説得する。
論文 参考訳(メタデータ) (2024-08-29T14:49:13Z) - Toward Optimal LLM Alignments Using Two-Player Games [86.39338084862324]
本稿では,対戦相手と防御エージェントの反復的相互作用を含む2エージェントゲームのレンズによるアライメントについて検討する。
この反復的強化学習最適化がエージェントによって誘導されるゲームに対するナッシュ平衡に収束することを理論的に実証する。
安全シナリオにおける実験結果から、このような競争環境下での学習は、完全に訓練するエージェントだけでなく、敵エージェントと防御エージェントの両方に対する一般化能力の向上したポリシーにつながることが示されている。
論文 参考訳(メタデータ) (2024-06-16T15:24:50Z) - Helmsman of the Masses? Evaluate the Opinion Leadership of Large Language Models in the Werewolf Game [1.4565642534804486]
Werewolfのゲームをシミュレーションプラットフォームとして使用して,大規模言語モデル(LLM)の意見リーダーシップを評価する。
ゲームには保安官の役割が含まれ、議論を要約し、決定オプションを推奨する。
我々は、意見リーダーの批判的特徴に基づいて、2つの新しい指標を考案する。
論文 参考訳(メタデータ) (2024-04-02T02:46:18Z) - CivRealm: A Learning and Reasoning Odyssey in Civilization for
Decision-Making Agents [63.79739920174535]
文明ゲームに触発された環境であるCivRealmを紹介する。
CivRealmは、意思決定エージェントにとってユニークな学習と推論の課題である。
論文 参考訳(メタデータ) (2024-01-19T09:14:11Z) - Exploring Large Language Models for Communication Games: An Empirical Study on Werewolf [19.39740531672788]
通信ゲームにおいて,大規模言語モデルに係わるチューニング不要なフレームワークを提案する。
代表的で広く研究されているコミュニケーションゲームWerewolf'の実証的研究は、我々のフレームワークがLLMのパラメータを調整せずにWerewolfゲームを効果的にプレイできることを実証している。
論文 参考訳(メタデータ) (2023-09-09T01:56:40Z) - Improving Language Model Negotiation with Self-Play and In-Context
Learning from AI Feedback [97.54519989641388]
交渉ゲームにおいて,複数大言語モデル(LLM)が,遊び,振り返り,批判によって自律的に互いに改善できるかどうかを検討する。
私たちが考慮している言語モデルのサブセットだけが、AIフィードバックから自己プレイし、取引価格を改善することができます。
論文 参考訳(メタデータ) (2023-05-17T11:55:32Z) - Werewolf Among Us: A Multimodal Dataset for Modeling Persuasion
Behaviors in Social Deduction Games [45.55448048482881]
本稿では,説得行動のモデル化のための最初のマルチモーダルデータセットを提案する。
データセットには199の対話文とビデオ,26,647の発話レベルアノテーションの説得戦略,ゲームレベルアノテーションの推論ゲーム結果が含まれている。
論文 参考訳(メタデータ) (2022-12-16T04:52:53Z) - A Novel Weighted Ensemble Learning Based Agent for the Werewolf Game [0.0]
ワイアウルフは世界中で人気のあるパーティーゲームであり、近年その重要性の研究が進んでいる。
本研究では,複雑な重み付きアンサンブル学習手法を用いて,Werewolfをプレイする洗練されたエージェントを作成した。
論文 参考訳(メタデータ) (2022-05-19T19:19:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。