論文の概要: A Genetic Algorithm approach to Asymmetrical Blotto Games with
Heterogeneous Valuations
- arxiv url: http://arxiv.org/abs/2103.14372v1
- Date: Fri, 26 Mar 2021 10:20:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 19:18:39.617190
- Title: A Genetic Algorithm approach to Asymmetrical Blotto Games with
Heterogeneous Valuations
- Title(参考訳): 不均一なバリュエーションを持つ非対称ブロットゲームに対する遺伝的アルゴリズムアプローチ
- Authors: Aymeric Vie
- Abstract要約: Blotto Gamesは多次元戦略資源割り当ての一般的なモデルである。
この問題を解決するために,生物進化から着想を得た遺伝的アルゴリズムを社会学習と解釈した。
遺伝的アルゴリズムは, 対称ブロットゲームの解析的ナッシュ均衡に収束することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Blotto Games are a popular model of multi-dimensional strategic resource
allocation. Two players allocate resources in different battlefields in an
auction setting. While competition with equal budgets is well understood,
little is known about strategic behavior under asymmetry of resources. We
introduce a genetic algorithm, a search heuristic inspired from biological
evolution, interpreted as social learning, to solve this problem. Most
performant strategies are combined to create more performant strategies.
Mutations allow the algorithm to efficiently scan the space of possible
strategies, and consider a wide diversity of deviations. We show that our
genetic algorithm converges to the analytical Nash equilibrium of the symmetric
Blotto game. We present the solution concept it provides for asymmetrical
Blotto games. It notably sees the emergence of "guerilla warfare" strategies,
consistent with empirical and experimental findings. The player with less
resources learns to concentrate its resources to compensate for the asymmetry
of competition. When players value battlefields heterogeneously, counter
strategies and bidding focus is obtained in equilibrium. These features are
consistent with empirical and experimental findings, and provide a learning
foundation for their existence.
- Abstract(参考訳): Blotto Gamesは多次元戦略資源割り当ての一般的なモデルである。
2人のプレーヤーがオークションの設定で異なる戦場でリソースを割り当てます。
等しい予算との競合はよく理解されているが、資源の非対称性の下での戦略行動についてはほとんど知られていない。
この問題を解決するために, 遺伝的アルゴリズム, 生物学的進化に触発された探索ヒューリスティック, 社会学習として解釈する。
ほとんどのパフォーマンス戦略が組み合わされ、パフォーマンス戦略が作成されます。
変異により、アルゴリズムは可能な戦略の空間を効率的にスキャンし、幅広い偏差を考慮できる。
遺伝的アルゴリズムは, 対称ブロットゲームの解析的ナッシュ均衡に収束することを示す。
非対称なブロットゲームに対する解の概念を提示する。
特に「ゲリラ戦」戦略の出現は、経験的および実験的発見と一致している。
リソースが少ないプレイヤーは、競争の非対称性を補うためにリソースに集中することを学ぶ。
プレイヤーが戦場を均一に評価すると、カウンター戦略と入札焦点が均衡して得られる。
これらの特徴は経験的および実験的発見と一致し、その存在の学習基盤を提供する。
関連論文リスト
- Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Strategic Resource Selection with Homophilic Agents [68.19497461624208]
類似エージェントとの共同資源利用を目指す異種エージェントを用いたリソース選択ゲームを提案する。
モデルでは,異なるタイプのエージェントを考慮し,その決定的特徴はユーザ間の同一型エージェントの割合である。
このような有界な有理性はゲーム理論上有利な性質を持つことを示す。
論文 参考訳(メタデータ) (2023-05-01T14:14:58Z) - Finding Nash equilibria by minimizing approximate exploitability with
learned best responses [68.75684174531962]
連続的なアクションセットを持つゲームの近似的ナッシュ均衡を求める問題について検討する。
本稿では,戦略プロファイルに対するエクスプロイラビリティの近似を最小化する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2023-01-20T23:55:30Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Generating Diverse and Competitive Play-Styles for Strategy Games [58.896302717975445]
ターン型戦略ゲーム(Tribes)のためのプログレッシブアンプランによるPortfolio Monte Carlo Tree Searchを提案する。
品質分散アルゴリズム(MAP-Elites)を使用して異なるプレイスタイルを実現し、競争レベルを維持しながらパラメータ化する方法を示します。
その結果,このアルゴリズムは,トレーニングに用いるレベルを超えて,幅広いゲームレベルにおいても,これらの目標を達成できることが示された。
論文 参考訳(メタデータ) (2021-04-17T20:33:24Z) - Hindsight and Sequential Rationality of Correlated Play [18.176128899338433]
私たちは、修正された振る舞いで達成できたことに対して、強いパフォーマンスを後見で保証するアルゴリズムを検討します。
我々は,学習の隠れた枠組みを,逐次的な意思決定の場で開発し,提唱する。
本稿では,それぞれの平衡の強さと弱さを文献に示す例を示す。
論文 参考訳(メタデータ) (2020-12-10T18:30:21Z) - On the Impossibility of Convergence of Mixed Strategies with No Regret
Learning [10.515544361834241]
最適無後悔学習戦略の一般クラスから得られる混合戦略の収束特性について検討する。
各ステップに設定された情報を相手の実演の実証平均とする戦略のクラスを考察する。
論文 参考訳(メタデータ) (2020-12-03T18:02:40Z) - Efficient exploration of zero-sum stochastic games [83.28949556413717]
ゲームプレイを通じて,ゲームの記述を明示せず,託宣のみにアクセス可能な,重要で一般的なゲーム解決環境について検討する。
限られたデュレーション学習フェーズにおいて、アルゴリズムは両方のプレイヤーのアクションを制御し、ゲームを学習し、それをうまくプレイする方法を学習する。
私たちのモチベーションは、クエリされた戦略プロファイルの支払いを評価するのにコストがかかる状況において、利用可能性の低い戦略を迅速に学習することにあります。
論文 参考訳(メタデータ) (2020-02-24T20:30:38Z) - Optimal strategies in the Fighting Fantasy gaming system: influencing
stochastic dynamics by gambling with limited resource [0.0]
Fighting Fantasyは、世界で人気のあるレクリエーションファンタジーゲームシステムである。
各ラウンドでは、限られた資源(Luck')がギャンブルに費やされ、勝利の利益を増幅したり、損失から赤字を軽減したりすることができる。
我々は,システムに対するベルマン方程式の解法と,ゲーム中の任意の状態に対する最適な戦略を特定するために,後方帰納法を用いる。
論文 参考訳(メタデータ) (2020-02-24T11:31:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。