論文の概要: Nested replicator dynamics, nested logit choice, and similarity-based learning
- arxiv url: http://arxiv.org/abs/2407.17815v1
- Date: Thu, 25 Jul 2024 07:09:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-26 14:57:54.020135
- Title: Nested replicator dynamics, nested logit choice, and similarity-based learning
- Title(参考訳): Nested replicator dynamics, nested logit choice, and similarity-based learning
- Authors: Panayotis Mertikopoulos, William H. Sandholm,
- Abstract要約: 我々は,分割型類似性構造を持つアクションセットを持つゲームにおいて,学習と進化のモデルを考える。
このモデルでは、修正エージェントは現在の戦略と類似とみなす他の戦略を比較する確率が高い。
同様の戦略に対するこの暗黙の偏見のため、結果として生じる力学は模倣ゲーム力学の標準的な単調性合理性のいずれかを満たすことができない。
- 参考スコア(独自算出の注目度): 56.98352103321524
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a model of learning and evolution in games whose action sets are endowed with a partition-based similarity structure intended to capture exogenous similarities between strategies. In this model, revising agents have a higher probability of comparing their current strategy with other strategies that they deem similar, and they switch to the observed strategy with probability proportional to its payoff excess. Because of this implicit bias toward similar strategies, the resulting dynamics - which we call the nested replicator dynamics - do not satisfy any of the standard monotonicity postulates for imitative game dynamics; nonetheless, we show that they retain the main long-run rationality properties of the replicator dynamics, albeit at quantitatively different rates. We also show that the induced dynamics can be viewed as a stimulus-response model in the spirit of Erev & Roth (1998), with choice probabilities given by the nested logit choice rule of Ben-Akiva (1973) and McFadden (1978). This result generalizes an existing relation between the replicator dynamics and the exponential weights algorithm in online learning, and provides an additional layer of interpretation to our analysis and results.
- Abstract(参考訳): アクションセットに、戦略間の外生的類似性を捉えるための分割ベースの類似性構造を付与したゲームにおいて、学習と進化のモデルを考える。
このモデルでは、修正エージェントは、現在の戦略と類似とみなす他の戦略を比較する確率が高く、彼らは、その支払い過剰に比例する確率で観察された戦略に切り替える。
同様の戦略に対するこの暗黙の偏りから、ネストされた複製子力学と呼ばれる結果のダイナミクスは、模倣ゲーム力学の標準的な単調性仮定を満足しない。
また、誘導力学は、Erev & Roth (1998) の精神における刺激応答モデルと見なすことができ、Ben-Akiva (1973) と McFadden (1978) のネストされたロジット選択則により選択確率が与えられることを示した。
この結果は、オンライン学習における複製子力学と指数重み付けアルゴリズムの既存の関係を一般化し、分析と結果に付加的な解釈層を提供する。
関連論文リスト
- Dynamic Post-Hoc Neural Ensemblers [55.15643209328513]
本研究では,ニューラルネットワークをアンサンブル手法として活用することを検討する。
低多様性のアンサンブルを学習するリスクを動機として,ベースモデル予測をランダムにドロップすることでモデルの正規化を提案する。
このアプローチはアンサンブル内の多様性を低くし、オーバーフィッティングを減らし、一般化能力を向上させる。
論文 参考訳(メタデータ) (2024-10-06T15:25:39Z) - Nonparametric Partial Disentanglement via Mechanism Sparsity: Sparse
Actions, Interventions and Sparse Temporal Dependencies [58.179981892921056]
この研究は、メカニズムのスパーシティ正則化(英語版)と呼ばれる、アンタングルメントの新たな原理を導入する。
本稿では,潜在要因を同時に学習することで,絡み合いを誘発する表現学習手法を提案する。
学習した因果グラフをスパースに規則化することにより、潜伏因子を復元できることを示す。
論文 参考訳(メタデータ) (2024-01-10T02:38:21Z) - Loss Dynamics of Temporal Difference Reinforcement Learning [36.772501199987076]
線形関数近似器を用いた値関数の時間差学習のためのケースラーニング曲線について検討した。
本研究では,学習力学と台地が特徴構造,学習率,割引係数,報酬関数にどのように依存するかを検討する。
論文 参考訳(メタデータ) (2023-07-10T18:17:50Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Factorized Fusion Shrinkage for Dynamic Relational Data [16.531262817315696]
本稿では,すべての分解因子がグループ単位の核融合構造に対して動的に縮小される因子化核融合収縮モデルについて考察する。
提案手法は、推定された動的潜在因子の比較とクラスタリングにおいて、多くの好ましい特性を享受する。
本稿では、最適後部推論と計算スケーラビリティのバランスをとる構造的平均場変動推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T21:03:40Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - The Role of Isomorphism Classes in Multi-Relational Datasets [6.419762264544509]
アイソモーフィックリークは,マルチリレーショナル推論の性能を過大評価することを示す。
モデル評価のためのアイソモーフィック・アウェア・シンセサイティング・ベンチマークを提案する。
また、同型類は単純な優先順位付けスキームによって利用することができることを示した。
論文 参考訳(メタデータ) (2020-09-30T12:15:24Z) - Momentum Accelerates Evolutionary Dynamics [4.061135251278187]
運動量によって、レプリカータ方程式やユークリッド勾配降下を含む進化力学の収束が促進されることを示す。
また, これらの力学の収束特性は, 例えば, 岩壁・筋の地形に付随するサイクリングを破ることによって, 運動量によって変化させることができることを示す。
論文 参考訳(メタデータ) (2020-07-05T21:09:30Z) - Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。
分散による離散乗法雑音のパラメータによく現れることを示す。
最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文 参考訳(メタデータ) (2020-06-11T09:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。