論文の概要: WallZero: Mastering the Game of WallGo with Strategic Analysis
- arxiv url: http://arxiv.org/abs/2606.17847v1
- Date: Tue, 16 Jun 2026 12:16:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.423447
- Title: WallZero: Mastering the Game of WallGo with Strategic Analysis
- Title(参考訳): WallZero:戦略分析でWallGoのゲームをマスターする
- Authors: Hsing-Yu Chen, Jérôme Arjonilla, I-Chen Wu, Ti-Rong Wu,
- Abstract要約: WallGo(ウォールゴー)は、2025年のNetflixシリーズ『The Devil's Plan』で人気を博した戦略的なボードゲームである。
人気は高まっているものの、WallGoはいまだに過小評価されている。
本稿では,AlphaZeroをベースとした2プレーヤのWallGo設定用エージェントであるWallZeroについて述べる。
- 参考スコア(独自算出の注目度): 10.50461099517758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: WallGo is a recently introduced strategic board game popularized by the 2025 Netflix series The Devil's Plan. Although played on a small 7 x 7 board, its combination of stone movement and wall placement yields high game-tree complexity and intricate strategic interactions. Despite its growing popularity, WallGo remains underexplored. This paper presents WallZero, an AlphaZero-based agent for the two-player WallGo setting. We introduce tailored action and feature designs to improve playing performance significantly. In the evaluation, WallZero defeats two professional Go players who participated in this study, securing on average 1.98x more territory per game. Beyond its strength, we use WallZero to assess game fairness and identify key strategies for mastering WallGo. Interestingly, our results show that the opening used in the Netflix series yields a more balanced game. Our code is available at https://rlg.iis.sinica.edu.tw/papers/wallzero.
- Abstract(参考訳): WallGoは、2025年のNetflixシリーズ『The Devil's Plan』で普及した戦略ボードゲームである。
小さい7 x 7のボードでプレイするが、石の動きと壁の配置の組み合わせは、高いゲームツリーの複雑さと複雑な戦略的相互作用をもたらす。
人気は高まっているものの、WallGoはいまだに過小評価されている。
本稿では,AlphaZeroをベースとした2プレーヤのWallGo設定用エージェントであるWallZeroについて述べる。
演奏性能を大幅に向上させるために,動作調整と特徴設計を導入する。
評価において、WallZeroは、この研究に参加した2人のプロのGoプレーヤーを破り、ゲーム当たりの平均1.98倍の領域を確保した。
その強みの他に、WallZeroを使ってゲームフェアネスを評価し、WallGoをマスターするための重要な戦略を特定します。
興味深いことに、Netflixシリーズで使われているオープニングは、よりバランスの取れたゲームになる。
私たちのコードはhttps://rlg.iis.sinica.edu.tw/papers/wallzeroで利用可能です。
関連論文リスト
- Adversarial Learning in Games with Bandit Feedback: Logarithmic Pure-Strategy Maximin Regret [64.73231630190121]
ゼロサムゲームを学ぶことは、ゲーム理論と機械学習の基本的な問題である。
ビジットフィードバックによるゼロサムゲームにおける対戦学習について検討し,最大戦略に対する障害を最小限に抑えることを目的とした。
我々は,Tsallis-INFアルゴリズムがゲーム依存パラメータ$c$で$O(c log T)$インスタンス依存後悔を実現することを示す。
論文 参考訳(メタデータ) (2026-02-06T03:26:01Z) - Mastering Strategy Card Game (Hearthstone) with Improved Techniques [8.399453146308502]
戦略カードゲームはインテリジェントなゲームプレイを必要としており、AIにとって理想的なテストベンチになり得る。
これまでの仕事は、エンドツーエンドのポリシー機能と楽観的なスムーズな架空の遊びを組み合わせたものだった。
本研究では,ゲームルールや機構が複雑である有名な商用ゲームであるHerthstoneに対して,そのようなアルゴリズムを適用する。
論文 参考訳(メタデータ) (2023-03-09T11:52:52Z) - Targeted Search Control in AlphaZero for Effective Policy Improvement [93.30151539224144]
我々はAlphaZeroの新しい検索制御戦略であるGo-Exploitを紹介する。
Go-Exploitは、関心のある状態のアーカイブからセルフプレイトラジェクトリの開始状態をサンプリングする。
Go-Exploitは、標準のAlphaZeroよりも優れたサンプル効率で学習する。
論文 参考訳(メタデータ) (2023-02-23T22:50:24Z) - Are AlphaZero-like Agents Robust to Adversarial Perturbations? [73.13944217915089]
AlphaZero(AZ)は、ニューラルネットワークベースのGo AIが人間のパフォーマンスを大きく上回ることを示した。
私たちは、Go AIが驚くほど間違った行動を起こさせる可能性のある、敵対的な状態が存在するかどうか尋ねる。
我々は、Go AIに対する最初の敵攻撃を開発し、探索空間を戦略的に減らし、効率よく敵の状態を探索する。
論文 参考訳(メタデータ) (2022-11-07T18:43:25Z) - Mastering the Game of Stratego with Model-Free Multiagent Reinforcement
Learning [86.37438204416435]
Strategoは、人工知能(AI)がまだマスターしていない数少ない象徴的なボードゲームの一つだ。
ストラテゴにおける決定は、行動と結果の間に明らかな結びつきがなく、多数の個別の行動に対してなされる。
DeepNashは、ストラテゴの既存の最先端AIメソッドを破り、Gravonゲームプラットフォームで年間(2022年)と最高3位を達成した。
論文 参考訳(メタデータ) (2022-06-30T15:53:19Z) - Impartial Games: A Challenge for Reinforcement Learning [0.0]
我々は,AlphaZeroスタイルの強化学習アルゴリズムが,公平なゲームに適用した場合,重要かつ基本的な課題に直面することを示す。
その結果,AlphaZeroスタイルのエージェントはチャンピオンレベルのプレーを達成できるが,ボードサイズが大きくなるにつれて学習の進歩は著しく低下することがわかった。
これらの結果は、AlphaZeroスタイルのアルゴリズムの攻撃に対する脆弱性に関するより広範な懸念と一致している。
論文 参考訳(メタデータ) (2022-05-25T14:02:02Z) - Leela Zero Score: a Study of a Score-based AlphaGo Zero [1.904940310103857]
Leela Zero ScoreはLeela Zeroとして知られるオープンソースのソリューションに基づいて設計されている。
9x9ボードでトレーニングされ、勝利率ではなくスコア差を予測する。
トレーニングによって合理的なプレイヤーが生成され、そのスタイルを強いアマチュアの人間プレイヤーに対して分析する。
論文 参考訳(メタデータ) (2022-01-31T12:38:02Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z) - Polygames: Improved Zero Learning [21.114734326593002]
DeepMindのAlphaZero以来、ゼロラーニングは多くのボードゲームで最先端の手法となった。
ゲームライブラリとチェックポイントを備えた,ゼロ学習のためのフレームワークであるPolygamesをリリースする。
私たちは1919年のヘックスの試合で強い人間と対戦しました。
論文 参考訳(メタデータ) (2020-01-27T14:49:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。