論文の概要: Mastering the Game of Guandan with Deep Reinforcement Learning and
Behavior Regulating
- arxiv url: http://arxiv.org/abs/2402.13582v1
- Date: Wed, 21 Feb 2024 07:26:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 16:30:51.540019
- Title: Mastering the Game of Guandan with Deep Reinforcement Learning and
Behavior Regulating
- Title(参考訳): 深層強化学習と行動規制によるガンダンのゲーム習得
- Authors: Yifan Yanggong, Hao Pan, Lei Wang
- Abstract要約: 我々は,グアンダンのゲームをマスターするAIエージェントのためのフレームワークGuanZeroを提案する。
本論文の主な貢献は、注意深く設計されたニューラルネットワーク符号化方式によるエージェントの動作の制御である。
- 参考スコア(独自算出の注目度): 16.718186690675164
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Games are a simplified model of reality and often serve as a favored platform
for Artificial Intelligence (AI) research. Much of the research is concerned
with game-playing agents and their decision making processes. The game of
Guandan (literally, "throwing eggs") is a challenging game where even
professional human players struggle to make the right decision at times. In
this paper we propose a framework named GuanZero for AI agents to master this
game using Monte-Carlo methods and deep neural networks. The main contribution
of this paper is about regulating agents' behavior through a carefully designed
neural network encoding scheme. We then demonstrate the effectiveness of the
proposed framework by comparing it with state-of-the-art approaches.
- Abstract(参考訳): ゲームは現実の単純化されたモデルであり、しばしば人工知能(AI)研究の好ましいプラットフォームとして機能する。
研究の多くは、ゲームプレイングエージェントとその意思決定プロセスに関するものだ。
グアンダンゲーム(英語: game of guandan)は、プロの人間の選手でさえ、時に正しい決定を下すのに苦労するチャレンジゲームである。
本稿では,モンテカルロ法とディープニューラルネットワークを用いたAIエージェントのためのフレームワークGuanZeroを提案する。
本論文の主な貢献は,ニューラルネットワーク符号化方式を用いてエージェントの動作を制御することである。
次に,最先端手法との比較により,提案フレームワークの有効性を実証する。
関連論文リスト
- Optimizing Hearthstone Agents using an Evolutionary Algorithm [0.0]
本稿では,カードゲーム『Harthstone』をプレイするエージェントの開発に進化的アルゴリズム(EA)を用いることを提案する。
エージェントは競争力のある共進化的トレーニングアプローチによって自己学習を特徴とする。
提案されたアプローチによって開発されたエージェントの1つは、国際ヘースストーン人工知能(AI)コンペティションにおけるランナーアップ(6%)であった。
論文 参考訳(メタデータ) (2024-10-25T16:49:11Z) - You Have Thirteen Hours in Which to Solve the Labyrinth: Enhancing AI Game Masters with Function Calling [35.721053667746716]
本稿では,テーブルトップロールプレイングゲーム "Jim Henson's Labyrinth: The Adventure Game" のコンテキストにおける関数呼び出しを活用することで,AIゲームマスタを強化する新たなアプローチを提案する。
本手法は,AIゲームマスタの物語的品質と状態更新の整合性の向上を示す関数を通じてゲーム固有の制御を統合することを含む。
論文 参考訳(メタデータ) (2024-09-11T02:03:51Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - Towards Controllable Agent in MOBA Games with Generative Modeling [0.45687771576879593]
我々は,人間のように振る舞うアクション制御可能なエージェントを開発するための新しい手法を提案する。
トレーニングエージェントのための潜時アライメントニューラルネットワークモデルと、エージェントの動作を制御するための対応するサンプリングアルゴリズムを考案する。
ゲーム『Honor of Kings』におけるシミュレーションおよびオンライン実験は、提案手法の有効性を実証している。
論文 参考訳(メタデータ) (2021-12-15T13:09:22Z) - DouZero: Mastering DouDizhu with Self-Play Deep Reinforcement Learning [65.00325925262948]
本稿では,概念的にシンプルで効果的なDouDizhu AIシステム,すなわちDouZeroを提案する。
DouZeroは、ディープニューラルネットワーク、アクションエンコーディング、並列アクターによる従来のモンテカルロ法を強化している。
ボットゾーンのリーダーボードでは344人のAIエージェントの中で第1位にランクインした。
論文 参考訳(メタデータ) (2021-06-11T02:45:51Z) - Teach me to play, gamer! Imitative learning in computer games via
linguistic description of complex phenomena and decision tree [55.41644538483948]
本稿では,複雑な現象の言語記述に基づく模倣による新しい機械学習モデルを提案する。
この手法は,ゲーム開発における知的エージェントの動作を設計し,実装するための優れた代替手段となる。
論文 参考訳(メタデータ) (2021-01-06T21:14:10Z) - DeepCrawl: Deep Reinforcement Learning for Turn-based Strategy Games [137.86426963572214]
Deep CrawlはiOSとAndroid用の完全にプレイ可能なRogueライクなプロトタイプで、すべてのエージェントがDeep Reinforcement Learning (DRL)を使用してトレーニングされたポリシーネットワークによって制御される。
本研究の目的は、近年のDRLの進歩が、ビデオゲームにおける非プレイヤーキャラクターに対する説得力のある行動モデルの開発に有効であるかどうかを理解することである。
論文 参考訳(メタデータ) (2020-12-03T13:53:29Z) - Physically Embedded Planning Problems: New Challenges for Reinforcement
Learning [26.74526714574981]
近年の深層強化学習(RL)では,囲碁,チェス,小技などの挑戦的なゲームを習得するアルゴリズムが開発されている。
物理的に組込みの計画問題を導入し、それらを一般公開する。
既存のRLアルゴリズムは、物理的に埋め込まれたアルゴリズムの中でも、最も単純なアルゴリズムを習得するのに苦労している。
論文 参考訳(メタデータ) (2020-09-11T16:56:33Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。