論文の概要: Evolutionary Strategies with Analogy Partitions in p-guessing Games
- arxiv url: http://arxiv.org/abs/2103.14379v1
- Date: Fri, 26 Mar 2021 10:28:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 19:18:59.196832
- Title: Evolutionary Strategies with Analogy Partitions in p-guessing Games
- Title(参考訳): pゲーミングゲームにおけるアナロジー分割を用いた進化戦略
- Authors: Aymeric Vie
- Abstract要約: 不安定なpゲーム環境における学習のダイナミクスを研究するために,学習の進化過程を導入する。
我々の遺伝的アルゴリズムは、ナッシュ平衡に収束して、持続的な環境における過去の結果と一貫して振る舞うことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Keynesian Beauty Contests notably modeled by p-guessing games, players try
to guess the average of guesses multiplied by p. Convergence of plays to Nash
equilibrium has often been justified by agents' learning. However,
interrogations remain on the origin of reasoning types and equilibrium behavior
when learning takes place in unstable environments. When successive values of p
can take values above and below 1, bounded rational agents may learn about
their environment through simplified representations of the game, reasoning
with analogies and constructing expectations about the behavior of other
players. We introduce an evolutionary process of learning to investigate the
dynamics of learning and the resulting optimal strategies in unstable
p-guessing games environments with analogy partitions. As a validation of the
approach, we first show that our genetic algorithm behaves consistently with
previous results in persistent environments, converging to the Nash
equilibrium. We characterize strategic behavior in mixed regimes with unstable
values of p. Varying the number of iterations given to the genetic algorithm to
learn about the game replicates the behavior of agents with different levels of
reasoning of the level k approach. This evolutionary process hence proposes a
learning foundation for endogenizing existence and transitions between levels
of reasoning in cognitive hierarchy models.
- Abstract(参考訳): ケインズの美容コンテスト(英語版)では、プレイヤーはpが乗じる推測の平均を推測しようとする。
ナッシュ均衡への遊びの収束はしばしばエージェントの学習によって正当化された。
しかし、学習が不安定な環境で行われる場合、推論タイプと平衡行動の起源には疑問が残る。
p の連続的な値が 1 以下の値を取ることができるとき、有界な有理エージェントはゲームの単純化された表現を通じて環境について学び、類似性を推論し、他のプレイヤーの行動に対する期待を構築することができる。
本稿では,ゲーム環境における学習のダイナミクスと学習結果の最適戦略を検討するために,学習の進化過程を紹介する。
このアプローチの検証として,我々の遺伝的アルゴリズムが,nash平衡に収束する永続環境において,これまでの結果と一貫して振る舞うことを示す。
p の不安定な値を持つ混合状態における戦略的挙動を特徴付ける。
遺伝的アルゴリズムがゲームについて学ぶために与えた反復数の変化は、レベルkアプローチの異なる推論レベルを持つエージェントの振る舞いを再現する。
この進化過程は、認知階層モデルにおける推論のレベル間の存在と遷移を固有化する学習基盤を提案する。
関連論文リスト
- Nested replicator dynamics, nested logit choice, and similarity-based learning [56.98352103321524]
我々は,分割型類似性構造を持つアクションセットを持つゲームにおいて,学習と進化のモデルを考える。
このモデルでは、修正エージェントは現在の戦略と類似とみなす他の戦略を比較する確率が高い。
同様の戦略に対するこの暗黙の偏見のため、結果として生じる力学は模倣ゲーム力学の標準的な単調性合理性のいずれかを満たすことができない。
論文 参考訳(メタデータ) (2024-07-25T07:09:53Z) - Exploiting hidden structures in non-convex games for convergence to Nash
equilibrium [62.88214569402201]
現代の機械学習アプリケーションは、非協調的なナッシュリリアとして定式化することができる。
決定論的環境と決定論的環境の両方に明確な収束保証を提供する。
論文 参考訳(メタデータ) (2023-12-27T15:21:25Z) - The equivalence of dynamic and strategic stability under regularized
learning in games [33.74394172275373]
有限ゲームにおける正規化学習の長時間動作について検討する。
戦略的安定性と動的安定性の等価性を得る。
エントロピー正則化に基づく手法は幾何速度で収束することを示す。
論文 参考訳(メタデータ) (2023-11-04T14:07:33Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - A unified stochastic approximation framework for learning in games [82.74514886461257]
ゲームにおける学習の長期的挙動(連続的・有限的)を解析するためのフレキシブルな近似フレームワークを開発する。
提案する分析テンプレートには,勾配に基づく手法,有限ゲームでの学習のための指数的/乗算的重み付け,楽観的および帯域的変異など,幅広い一般的な学習アルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2022-06-08T14:30:38Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Bounded rationality for relaxing best response and mutual consistency:
An information-theoretic model of partial self-reference [0.0]
この研究は、相互整合性やベストレスポンスなど、合理的性の前提となるいくつかの仮定に焦点を当てている。
我々は、レベル-$k$推論と量子応答平衡(QRE)の概念を用いて、これらの仮定を緩和する方法を検討する。
論文 参考訳(メタデータ) (2021-06-30T06:56:56Z) - Hindsight and Sequential Rationality of Correlated Play [18.176128899338433]
私たちは、修正された振る舞いで達成できたことに対して、強いパフォーマンスを後見で保証するアルゴリズムを検討します。
我々は,学習の隠れた枠組みを,逐次的な意思決定の場で開発し,提唱する。
本稿では,それぞれの平衡の強さと弱さを文献に示す例を示す。
論文 参考訳(メタデータ) (2020-12-10T18:30:21Z) - On Information Asymmetry in Competitive Multi-Agent Reinforcement
Learning: Convergence and Optimality [78.76529463321374]
協調的でない2つのQ-ラーニングエージェントの相互作用システムについて検討する。
この情報非対称性は、集団学習の安定した結果をもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2020-10-21T11:19:53Z) - The Evolutionary Dynamics of Independent Learning Agents in Population
Games [21.68881173635777]
本稿では,集団ゲームにおける独立学習エージェントのプロセスとダイナミクスの形式的関係について述べる。
マスター方程式アプローチを用いて、人口動態を特徴付けるための新しい統一的な枠組みを提供する。
論文 参考訳(メタデータ) (2020-06-29T14:22:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。