論文の概要: Playing the Werewolf game with artificial intelligence for language
understanding
- arxiv url: http://arxiv.org/abs/2302.10646v1
- Date: Tue, 21 Feb 2023 13:03:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 15:10:12.952989
- Title: Playing the Werewolf game with artificial intelligence for language
understanding
- Title(参考訳): 言語理解のための人工知能を用いたWerewolfゲーム
- Authors: Hisaichi Shibata, Soichiro Miki, Yuta Nakamura
- Abstract要約: ワイアウルフ(Werewolf)は、自由な自然言語通信に基づくソーシャル推論ゲームである。
本研究の目的は、自然言語会話を通じてWerewolfをプレイできるAIエージェントを開発することである。
- 参考スコア(独自算出の注目度): 0.7550566004119156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Werewolf game is a social deduction game based on free natural language
communication, in which players try to deceive others in order to survive. An
important feature of this game is that a large portion of the conversations are
false information, and the behavior of artificial intelligence (AI) in such a
situation has not been widely investigated. The purpose of this study is to
develop an AI agent that can play Werewolf through natural language
conversations. First, we collected game logs from 15 human players. Next, we
fine-tuned a Transformer-based pretrained language model to construct a value
network that can predict a posterior probability of winning a game at any given
phase of the game and given a candidate for the next action. We then developed
an AI agent that can interact with humans and choose the best voting target on
the basis of its probability from the value network. Lastly, we evaluated the
performance of the agent by having it actually play the game with human
players. We found that our AI agent, Deep Wolf, could play Werewolf as
competitively as average human players in a villager or a betrayer role,
whereas Deep Wolf was inferior to human players in a werewolf or a seer role.
These results suggest that current language models have the capability to
suspect what others are saying, tell a lie, or detect lies in conversations.
- Abstract(参考訳): ウェアウルフゲーム(Werewolf game)は、プレイヤーが生き残るために他人を騙そうとする、自由な自然言語通信に基づく社会的推論ゲームである。
このゲームの重要な特徴は、会話の大部分は偽情報であり、そのような状況における人工知能(AI)の行動は広く研究されていないことである。
本研究の目的は、自然言語会話を通じてWerewolfをプレイできるAIエージェントを開発することである。
まず15人のプレイヤーからゲームログを収集した。
次に,トランスフォーマーをベースとした事前学習型言語モデルを微調整し,ゲームの任意のフェーズでゲームに勝つ確率を予測し,次のアクションの候補を与える値ネットワークを構築する。
そこで我々は,人間と対話し,その確率に基づいて最適な投票対象を選択するAIエージェントを開発した。
最後に,人間プレイヤーと実際にゲームをプレイさせることで,エージェントのパフォーマンスを評価した。
私たちは、私たちのAIエージェントであるDeep Wolfが、村人や裏切り者の平均的な人間プレイヤーと同じくらいの競争力でWerewolfをプレイできることを発見しました。
これらの結果は、現在の言語モデルは、他人が言っていることを疑ったり、嘘を言ったり、会話の嘘を検知する能力を持っていることを示唆している。
関連論文リスト
- An Implementation of Werewolf Agent That does not Truly Trust LLMs [0.8811927506272431]
Werewolfは不完全な情報ゲームであり、コンピュータエージェントをプレイヤーとして作る際にいくつかの課題がある。
本稿では,Large Language Model (LLM) とルールベースアルゴリズムを組み合わせることで,これらの問題の一部を解消するワーウルフエージェントを提案する。
論文 参考訳(メタデータ) (2024-09-03T03:16:03Z) - Explaining How a Neural Network Play the Go Game and Let People Learn [26.192580802652742]
AIモデルは、Goのゲームで人間のプレイヤーを追い越した。
AIモデルは、人間のプレイヤーを超えて、Goゲームに関する新しい知識をエンコードしたと広く信じられている。
論文 参考訳(メタデータ) (2023-10-15T13:57:50Z) - Hoodwinked: Deception and Cooperation in a Text-Based Game for Language
Models [0.0]
Mafia と among Us に触発された $textitHoodwinked$ というテキストベースのゲームを紹介します。
プレイヤーは家に閉じ込められ、逃げるための鍵を見つけなければならないが、一方のプレイヤーは他のプレイヤーを殺すことが義務付けられている。
我々は, GPT-3, GPT-3.5, GPT-4によって制御されたエージェントを用いて実験を行い, 偽造と嘘検出能力の証拠を見いだした。
論文 参考訳(メタデータ) (2023-07-05T17:22:09Z) - The Neuro-Symbolic Inverse Planning Engine (NIPE): Modeling
Probabilistic Social Inferences from Linguistic Inputs [50.32802502923367]
確率的目標推論領域における言語駆動の過程と社会的推論への影響について検討する。
本稿では,エージェントシナリオの言語入力から目標推定を行うニューロシンボリックモデルを提案する。
我々のモデルは人間の反応パターンと密に一致し、LLM単独の使用よりも人間の判断をより良く予測する。
論文 参考訳(メタデータ) (2023-06-25T19:38:01Z) - Human or Not? A Gamified Approach to the Turing Test [11.454575816255039]
チューリングテストに触発されたオンラインゲーム「Human or Not?
このゲームは1ヶ月で150万人以上のユーザーがプレイした。
全体として、ゲームの68%でパートナーの正体を正確に推測した。
ユーザーがAIボットに直面したゲームのサブセットでは、ユーザーは正しい推測率を60%も下げていた。
論文 参考訳(メタデータ) (2023-05-31T16:32:22Z) - Promptable Game Models: Text-Guided Game Simulation via Masked Diffusion
Models [68.85478477006178]
ニューラルビデオゲームシミュレータのためのPGM(Promptable Game Model)を提案する。
ユーザーは高レベルのアクションシーケンスと低レベルのアクションシーケンスでゲームを実行することができる。
私たちのPGMは、エージェントの目標をプロンプトの形で指定することで、ディレクターのモードをアンロックします。
提案手法は,既存のニューラルビデオゲームシミュレータのレンダリング品質を著しく上回り,現在の最先端の能力を超えたアプリケーションをアンロックする。
論文 参考訳(メタデータ) (2023-03-23T17:43:17Z) - Computational Charisma -- A Brick by Brick Blueprint for Building
Charismatic Artificial Intelligence [98.79723276712419]
チャリスタは、他者を惹きつけ、潜在的に影響を及ぼす能力であると考えられている。
このようなスキルを提供するという、AIの観点からはかなりの関心を持つことができます。
我々は、カリスマ的なように見えるが、他人のカリスマを分析できる機械を構築するための青写真を提示している。
論文 参考訳(メタデータ) (2022-12-31T07:27:01Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - A Novel Weighted Ensemble Learning Based Agent for the Werewolf Game [0.0]
ワイアウルフは世界中で人気のあるパーティーゲームであり、近年その重要性の研究が進んでいる。
本研究では,複雑な重み付きアンサンブル学習手法を用いて,Werewolfをプレイする洗練されたエージェントを作成した。
論文 参考訳(メタデータ) (2022-05-19T19:19:29Z) - Teach me to play, gamer! Imitative learning in computer games via
linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。
この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文 参考訳(メタデータ) (2021-01-06T21:14:10Z) - Suphx: Mastering Mahjong with Deep Reinforcement Learning [114.68233321904623]
我々は、新たに導入されたいくつかの技術を用いた深層強化学習に基づいて、Suphxという名のマフジョンのためのAIを設計する。
Suphxは、安定したランクの点で、ほとんどのトップの人間プレイヤーよりも強いパフォーマンスを示している。
コンピュータプログラムがマヒョンで最上位の人間プレイヤーを上回るのは、これが初めてである。
論文 参考訳(メタデータ) (2020-03-30T16:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。