論文の概要: OpenGuanDan: A Large-Scale Imperfect Information Game Benchmark
- arxiv url: http://arxiv.org/abs/2602.00676v1
- Date: Sat, 31 Jan 2026 11:46:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.331152
- Title: OpenGuanDan: A Large-Scale Imperfect Information Game Benchmark
- Title(参考訳): OpenGuanDan: 大規模な不完全な情報ゲームベンチマーク
- Authors: Chao Li, Shangdong Yang, Chiheng Zhan, Zhenxing Ge, Yujing Hu, Bingkun Bao, Xingguo Chen, Yang Gao,
- Abstract要約: OpenGuanDanは、GuanDanの効率的なシミュレーションと、学習ベースのAIエージェントとルールベースのAIエージェントの包括的な評価を可能にする、新しいベンチマークである。
OpenGuanDanは、不完全な情報、大規模な情報セットとアクションスペース、協力と競争を含む混合学習目標、長期的な意思決定、可変アクションスペース、動的チーム構成など、多くの非自明な課題を提起している。
我々は,(1)グアンダンのAIエージェント間のペアワイズ競争,(2)人間とAIのマッチングの2種類の評価を行う。
- 参考スコア(独自算出の注目度): 31.554414017099102
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The advancement of data-driven artificial intelligence (AI), particularly machine learning, heavily depends on large-scale benchmarks. Despite remarkable progress across domains ranging from pattern recognition to intelligent decision-making in recent decades, exemplified by breakthroughs in board games, card games, and electronic sports games, there remains a pressing need for more challenging benchmarks to drive further research. To this end, this paper proposes OpenGuanDan, a novel benchmark that enables both efficient simulation of GuanDan (a popular four-player, multi-round Chinese card game) and comprehensive evaluation of both learning-based and rule-based GuanDan AI agents. OpenGuanDan poses a suite of nontrivial challenges, including imperfect information, large-scale information set and action spaces, a mixed learning objective involving cooperation and competition, long-horizon decision-making, variable action spaces, and dynamic team composition. These characteristics make it a demanding testbed for existing intelligent decision-making methods. Moreover, the independent API for each player allows human-AI interactions and supports integration with large language models. Empirically, we conduct two types of evaluations: (1) pairwise competitions among all GuanDan AI agents, and (2) human-AI matchups. Experimental results demonstrate that while current learning-based agents substantially outperform rule-based counterparts, they still fall short of achieving superhuman performance, underscoring the need for continued research in multi-agent intelligent decision-making domain. The project is publicly available at https://github.com/GameAI-NJUPT/OpenGuanDan.
- Abstract(参考訳): データ駆動人工知能(AI)の進歩、特に機械学習は、大規模なベンチマークに大きく依存している。
パターン認識から知的意思決定まで、ここ数十年の領域で顕著な進歩を遂げたにもかかわらず、ボードゲーム、カードゲーム、電子スポーツゲームのブレークスルーによって実証されているが、さらなる研究を進めるためのより困難なベンチマークの必要性は、いまだに迫られている。
そこで本研究では,GuanDanの高速シミュレーションと,学習ベースとルールベースの両方のGuanDanAIエージェントの総合評価が可能な,新しいベンチマークであるOpenGuanDanを提案する。
OpenGuanDanは、不完全な情報、大規模な情報セットとアクションスペース、協力と競争を含む混合学習目標、長期的な意思決定、可変アクションスペース、動的チーム構成など、多くの非自明な課題を提起している。
これらの特徴は、既存のインテリジェントな意思決定方法に対する要求の高いテストベッドとなる。
さらに、各プレーヤの独立したAPIは、人間とAIのインタラクションを可能にし、大きな言語モデルとの統合をサポートする。
実験的な評価は,(1)グアンダンのAIエージェント間のペアワイズ競争,(2)人間とAIのマッチングの2種類である。
実験の結果、現在の学習ベースエージェントはルールベースのエージェントよりもかなり優れていますが、それでも超人的なパフォーマンスを達成するには至っていないことが示され、マルチエージェントの知的意思決定領域における継続的な研究の必要性が浮き彫りになっています。
プロジェクトはhttps://github.com/GameAI-NJUPT/OpenGuanDanで公開されている。
関連論文リスト
- Ad-Hoc Human-AI Coordination Challenge [6.933020756939985]
本稿では,費用がかかる人的評価の制約を克服するために,Ad-Hoc Human-AI Coordination Challenge (AH2AC2)を導入する。
我々は、堅牢で安価で再現可能な人間のような評価パートナーとして機能する大規模な人的データセット上に、テキスト・ヒューマン・プロキシー・エージェントを開発する。
論文 参考訳(メタデータ) (2025-06-26T17:19:52Z) - DanZero+: Dominating the GuanDan Game through Reinforcement Learning [95.90682269990705]
我々は、GuanDanという、非常に複雑で人気のあるカードゲームのためのAIプログラムを開発した。
私たちはまず、DanZeroという名のAIプログラムをこのゲームのために提案しました。
AIの能力をさらに強化するために、政策に基づく強化学習アルゴリズムをGuanDanに適用する。
論文 参考訳(メタデータ) (2023-12-05T08:07:32Z) - A Comprehensive Survey of AI-Generated Content (AIGC): A History of
Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。
AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文 参考訳(メタデータ) (2023-03-07T20:36:13Z) - Human-Centric Multimodal Machine Learning: Recent Advances and Testbed
on AI-based Recruitment [66.91538273487379]
人間中心のアプローチでAIアプリケーションを開発する必要性には、ある程度のコンセンサスがある。
i)ユーティリティと社会的善、(ii)プライバシとデータ所有、(iii)透明性と説明責任、(iv)AIによる意思決定プロセスの公正性。
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
論文 参考訳(メタデータ) (2023-02-13T16:44:44Z) - DanZero: Mastering GuanDan Game with Reinforcement Learning [121.93690719186412]
カードゲームAIは、人工知能の研究において常にホットな話題となっている。
本稿では,より複雑なカードゲームであるGuanDanのためのAIプログラムの開発に専念する。
そこで我々は,強化学習技術を用いたGuanDanのためのAIプログラムDanZeroを提案する。
論文 参考訳(メタデータ) (2022-10-31T06:29:08Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - TiKick: Toward Playing Multi-agent Football Full Games from Single-agent
Demonstrations [31.596018856092513]
Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、学習ベースのAIシステムである。
私たちの知る限りでは、Tikickは、マルチエージェントのGoogle Research Footballのフルゲームを引き継ぐことができる、初めての学習ベースのAIシステムだ。
論文 参考訳(メタデータ) (2021-10-09T08:34:58Z) - OpenHoldem: An Open Toolkit for Large-Scale Imperfect-Information Game
Research [82.09426894653237]
OpenHoldemは、NLTHを用いた大規模不完全情報ゲーム研究のための統合ツールキットです。
1)異なるNLTH AIを徹底的に評価するための標準化された評価プロトコル、2)NLTH AIのための3つの公的に利用可能な強力なベースライン、3)公開NLTH AI評価のための使いやすいAPIを備えたオンラインテストプラットフォーム。
論文 参考訳(メタデータ) (2020-12-11T07:24:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。