論文の概要: A Genetic Algorithm approach to Asymmetrical Blotto Games with
Heterogeneous Valuations
- arxiv url: http://arxiv.org/abs/2103.14372v1
- Date: Fri, 26 Mar 2021 10:20:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 19:18:39.617190
- Title: A Genetic Algorithm approach to Asymmetrical Blotto Games with
Heterogeneous Valuations
- Title(参考訳): 不均一なバリュエーションを持つ非対称ブロットゲームに対する遺伝的アルゴリズムアプローチ
- Authors: Aymeric Vie
- Abstract要約: Blotto Gamesは多次元戦略資源割り当ての一般的なモデルである。
この問題を解決するために,生物進化から着想を得た遺伝的アルゴリズムを社会学習と解釈した。
遺伝的アルゴリズムは, 対称ブロットゲームの解析的ナッシュ均衡に収束することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blotto Games are a popular model of multi-dimensional strategic resource
allocation. Two players allocate resources in different battlefields in an
auction setting. While competition with equal budgets is well understood,
little is known about strategic behavior under asymmetry of resources. We
introduce a genetic algorithm, a search heuristic inspired from biological
evolution, interpreted as social learning, to solve this problem. Most
performant strategies are combined to create more performant strategies.
Mutations allow the algorithm to efficiently scan the space of possible
strategies, and consider a wide diversity of deviations. We show that our
genetic algorithm converges to the analytical Nash equilibrium of the symmetric
Blotto game. We present the solution concept it provides for asymmetrical
Blotto games. It notably sees the emergence of "guerilla warfare" strategies,
consistent with empirical and experimental findings. The player with less
resources learns to concentrate its resources to compensate for the asymmetry
of competition. When players value battlefields heterogeneously, counter
strategies and bidding focus is obtained in equilibrium. These features are
consistent with empirical and experimental findings, and provide a learning
foundation for their existence.
- Abstract(参考訳): Blotto Gamesは多次元戦略資源割り当ての一般的なモデルである。
2人のプレーヤーがオークションの設定で異なる戦場でリソースを割り当てます。
等しい予算との競合はよく理解されているが、資源の非対称性の下での戦略行動についてはほとんど知られていない。
この問題を解決するために, 遺伝的アルゴリズム, 生物学的進化に触発された探索ヒューリスティック, 社会学習として解釈する。
ほとんどのパフォーマンス戦略が組み合わされ、パフォーマンス戦略が作成されます。
変異により、アルゴリズムは可能な戦略の空間を効率的にスキャンし、幅広い偏差を考慮できる。
遺伝的アルゴリズムは, 対称ブロットゲームの解析的ナッシュ均衡に収束することを示す。
非対称なブロットゲームに対する解の概念を提示する。
特に「ゲリラ戦」戦略の出現は、経験的および実験的発見と一致している。
リソースが少ないプレイヤーは、競争の非対称性を補うためにリソースに集中することを学ぶ。
プレイヤーが戦場を均一に評価すると、カウンター戦略と入札焦点が均衡して得られる。
これらの特徴は経験的および実験的発見と一致し、その存在の学習基盤を提供する。
関連論文リスト
- Securing Equal Share: A Principled Approach for Learning Multiplayer Symmetric Games [21.168085154982712]
マルチプレイヤーゲームにおける平衡は、一意でも爆発的でもない。
本稿では,平等な共有という自然な目的に焦点をあてることで,これらの課題に対処するための最初の一歩を踏み出す。
我々は、様々な設定でほぼ同じシェアを確実に得る、非回帰学習にインスパイアされた、一連の効率的なアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-06-06T15:59:17Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - ApproxED: Approximate exploitability descent via learned best responses [61.17702187957206]
連続的なアクションセットを持つゲームの近似的ナッシュ均衡を求める問題について検討する。
本稿では,戦略プロファイルに対するエクスプロイラビリティの近似を最小化する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-01-20T23:55:30Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Hindsight and Sequential Rationality of Correlated Play [18.176128899338433]
私たちは、修正された振る舞いで達成できたことに対して、強いパフォーマンスを後見で保証するアルゴリズムを検討します。
我々は,学習の隠れた枠組みを,逐次的な意思決定の場で開発し,提唱する。
本稿では,それぞれの平衡の強さと弱さを文献に示す例を示す。
論文 参考訳(メタデータ) (2020-12-10T18:30:21Z) - On the Impossibility of Convergence of Mixed Strategies with No Regret
Learning [10.515544361834241]
最適無後悔学習戦略の一般クラスから得られる混合戦略の収束特性について検討する。
各ステップに設定された情報を相手の実演の実証平均とする戦略のクラスを考察する。
論文 参考訳(メタデータ) (2020-12-03T18:02:40Z) - Learning to Play Sequential Games versus Unknown Opponents [93.8672371143881]
学習者が最初にプレーするゲームと、選択した行動に反応する相手との連続的なゲームについて考察する。
対戦相手の対戦相手列と対戦する際,学習者に対して新しいアルゴリズムを提案する。
我々の結果には、相手の反応の正則性に依存するアルゴリズムの後悔の保証が含まれている。
論文 参考訳(メタデータ) (2020-07-10T09:33:05Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。