Fugu-MT 論文翻訳(概要): Suspicion-Agent: Playing Imperfect Information Games with Theory of Mind Aware GPT-4

論文の概要: Suspicion-Agent: Playing Imperfect Information Games with Theory of Mind Aware GPT-4

arxiv url: http://arxiv.org/abs/2309.17277v3
Date: Sat, 31 Aug 2024 11:50:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-04 22:35:08.297714
Title: Suspicion-Agent: Playing Imperfect Information Games with Theory of Mind Aware GPT-4
Title（参考訳）: 疑似エージェント:心を意識したGPT-4による不完全な情報ゲーム
Authors: Jiaxian Guo, Bo Yang, Paul Yoo, Bill Yuchen Lin, Yusuke Iwasawa, Yutaka Matsuo,
Abstract要約: GPT-4は、大規模受動的データに基づいて訓練された最近の大規模言語モデル(LLM)のブレークスルーであり、その知識検索と推論能力で有名である。本稿では,不完全な情報ゲームに対するGPT-4の学習知識の適用性について述べる。本稿では,不完全な情報ゲームにおけるGPT-4の能力を活用する革新的なエージェントであるSuspicion-Agentを紹介する。
参考スコア（独自算出の注目度）: 37.64921394844022
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Unlike perfect information games, where all elements are known to every player, imperfect information games emulate the real-world complexities of decision-making under uncertain or incomplete information. GPT-4, the recent breakthrough in large language models (LLMs) trained on massive passive data, is notable for its knowledge retrieval and reasoning abilities. This paper delves into the applicability of GPT-4's learned knowledge for imperfect information games. To achieve this, we introduce \textbf{Suspicion-Agent}, an innovative agent that leverages GPT-4's capabilities for performing in imperfect information games. With proper prompt engineering to achieve different functions, Suspicion-Agent based on GPT-4 demonstrates remarkable adaptability across a range of imperfect information card games. Importantly, GPT-4 displays a strong high-order theory of mind (ToM) capacity, meaning it can understand others and intentionally impact others' behavior. Leveraging this, we design a planning strategy that enables GPT-4 to competently play against different opponents, adapting its gameplay style as needed, while requiring only the game rules and descriptions of observations as input. In the experiments, we qualitatively showcase the capabilities of Suspicion-Agent across three different imperfect information games and then quantitatively evaluate it in Leduc Hold'em. The results show that Suspicion-Agent can potentially outperform traditional algorithms designed for imperfect information games, without any specialized training or examples. In order to encourage and foster deeper insights within the community, we make our game-related data publicly available.
Abstract（参考訳）: すべての要素が全てのプレイヤーに知られている完全情報ゲームとは異なり、不完全な情報ゲームは不完全な情報や不完全な情報の下で意思決定の現実的な複雑さをエミュレートする。 GPT-4は、大規模受動的データに基づいて訓練された最近の大規模言語モデル(LLM)のブレークスルーであり、その知識検索と推論能力で有名である。本稿では,不完全な情報ゲームに対するGPT-4の学習知識の適用性について述べる。そこで本稿では,不完全な情報ゲームにおける GPT-4 の機能を活用する革新的なエージェントである \textbf{Suspicion-Agent} を紹介する。 GPT-4に基づくSuspicion-Agentは、適切なプロンプトエンジニアリングにより、様々な不完全な情報カードゲームに顕著な適応性を示す。重要なことは、GPT-4は強い高次心論(ToM)能力を示し、それは他人を理解し、故意に他人の行動に影響を与えることを意味する。これを活用することで、GPT-4が異なる対戦相手に対して能力的に対戦し、ゲームプレイスタイルを必要に応じて適応し、ゲームルールと観察記述のみを入力として要求する計画戦略を設計する。実験では,3つの不完全な情報ゲームにまたがるSuspicion-Agentの能力を質的に示すとともに,Leduc Hold'emで定量的に評価した。その結果、Suspicion-Agentは、特定の訓練や例を使わずに、不完全な情報ゲームのために設計された従来のアルゴリズムより優れている可能性が示唆された。コミュニティ内の深い洞察を奨励し、促進するために、ゲーム関連のデータを公開しています。

関連論文リスト

Look-ahead Reasoning with a Learned Model in Imperfect Information Games [3.4935179780034242]
本稿では,エージェントと環境の相互作用から不完全情報ゲームの抽象モデルを直接学習するアルゴリズムを提案する。テスト期間中、このトレーニングされたモデルは、ルックアヘッド推論を実行するために使用されます。 LAMIRは十分なキャパシティで正確なゲーム構造を学習し、限られたキャパシティではまだ貴重な抽象化を学習していることを実証的に実証する。
論文参考訳（メタデータ） (2025-10-06T17:26:56Z)
Evaluating GPT-4 at Grading Handwritten Solutions in Math Exams [48.99818550820575]
我々は、最先端のマルチモーダルAIモデル、特にGPT-4oを利用して、大学レベルの数学試験に対する手書きの応答を自動的に評価する。確率論試験における質問に対する実際の学生の反応を用いて, GPT-4oのスコアと, 様々なプロンプト技術を用いて, 人間の学級のスコアとの整合性を評価する。
論文参考訳（メタデータ） (2024-11-07T22:51:47Z)
Show, Don't Tell: Evaluating Large Language Models Beyond Textual Understanding with ChildPlay [0.0]
私たちは戦略的思考と意思決定を評価するために、Tic-Tac-Toe、Connect Four、Battleshipといったゲームを使用しています。標準ベンチマークに習熟しているにもかかわらず、GPT-3.5とGPT-4のプレイ能力と、事前トレーニングなしで完全に観察可能なゲームについて推論する能力は、ごくわずかである。
論文参考訳（メタデータ） (2024-07-12T14:17:26Z)
Are Large Language Models Strategic Decision Makers? A Study of Performance and Bias in Two-Player Non-Zero-Sum Games [56.70628673595041]
大規模言語モデル (LLM) は現実世界での利用が増えているが、その戦略的意思決定能力はほとんど探索されていない。本研究は,Stag Hunt と Prisoner Dilemma のカノニカルゲーム理論2人プレイヤ非ゼロサムゲームにおける LLM の性能とメリットについて検討する。 GPT-3.5, GPT-4-Turbo, GPT-4o, Llama-3-8Bの構造化評価は, これらのゲームにおいて決定を行う場合, 以下の系統的バイアスの少なくとも1つの影響を受けていることを示す。
論文参考訳（メタデータ） (2024-07-05T12:30:02Z)
Will GPT-4 Run DOOM? [0.0]
GPT-4の推論と計画能力は1993年のファーストパーソンシューティングゲーム『Doom』にまで拡張されている。 GPT-4は、ドアを操作し、敵と対戦し、パスを行うことができる。
論文参考訳（メタデータ） (2024-03-08T17:30:41Z)
GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition? [82.40761196684524]
本稿では,ゼロショット視覚認識タスクにおけるGPT-4の言語的・視覚的能力の評価に焦点を当てる。我々は、画像、ビデオ、点群にわたるGPT-4の性能を評価するための広範な実験を行った。言語記述が充実したGPT-4はゼロショット認識を著しく改善した。
論文参考訳（メタデータ） (2023-11-27T11:29:10Z)
Generative AI in Mafia-like Game Simulation [2.44755919161855]
この研究は、ゲームシナリオにおける理解、意思決定、相互作用におけるモデルの可能性を示すことを目的としていた。この結果は、GPT-4は以前のモデルよりも有望な進歩を示すが、さらなる発展の可能性を秘めていることを示唆している。
論文参考訳（メタデータ） (2023-09-20T22:38:34Z)
Towards Reliable Misinformation Mitigation: Generalization, Uncertainty, and GPT-4 [5.313670352036673]
GPT-4は,複数の設定や言語で先行手法より優れていることを示す。本研究では,不可能な事例を検出し,その結果を強く改善する不確実性に対処する手法を提案する。この研究は、偽情報と戦うために現実世界の進歩を促す将来のツールの基盤となる。
論文参考訳（メタデータ） (2023-05-24T09:10:20Z)
Sparks of Artificial General Intelligence: Early experiments with GPT-4 [66.1188263570629]
OpenAIが開発したGPT-4は、前例のない規模の計算とデータを使って訓練された。我々は, GPT-4が数学, コーディング, ビジョン, 医学, 法学, 心理学などにまたがる, 新規で困難な課題を解くことを実証した。我々は、GPT-4を人工知能(AGI)システムの早期(まだ未完成)版と見なすことができると信じている。
論文参考訳（メタデータ） (2023-03-22T16:51:28Z)
PerfectDou: Dominating DouDizhu with Perfect Information Distillation [51.069043489706836]
本研究では,現在最先端のDouDizhuAIシステムであるPerfectDouを提案する。実験では、PerfectDouが既存のAIプログラムをすべて破り、最先端のパフォーマンスを達成する方法と理由を示します。
論文参考訳（メタデータ） (2022-03-30T15:37:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。