論文の概要: The Evolutionary Dynamics of Independent Learning Agents in Population
Games
- arxiv url: http://arxiv.org/abs/2006.16068v1
- Date: Mon, 29 Jun 2020 14:22:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 14:13:17.331223
- Title: The Evolutionary Dynamics of Independent Learning Agents in Population
Games
- Title(参考訳): 集団ゲームにおける独立学習エージェントの進化ダイナミクス
- Authors: Shuyue Hu, Chin-Wing Leung, Ho-fung Leung, Harold Soh
- Abstract要約: 本稿では,集団ゲームにおける独立学習エージェントのプロセスとダイナミクスの形式的関係について述べる。
マスター方程式アプローチを用いて、人口動態を特徴付けるための新しい統一的な枠組みを提供する。
- 参考スコア(独自算出の注目度): 21.68881173635777
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Understanding the evolutionary dynamics of reinforcement learning under
multi-agent settings has long remained an open problem. While previous works
primarily focus on 2-player games, we consider population games, which model
the strategic interactions of a large population comprising small and anonymous
agents. This paper presents a formal relation between stochastic processes and
the dynamics of independent learning agents who reason based on the reward
signals. Using a master equation approach, we provide a novel unified framework
for characterising population dynamics via a single partial differential
equation (Theorem 1). Through a case study involving Cross learning agents, we
illustrate that Theorem 1 allows us to identify qualitatively different
evolutionary dynamics, to analyse steady states, and to gain insights into the
expected behaviour of a population. In addition, we present extensive
experimental results validating that Theorem 1 holds for a variety of learning
methods and population games.
- Abstract(参考訳): マルチエージェント環境下での強化学習の進化的ダイナミクスを理解することは、長い間オープンな問題であった。
先行研究は主に2人プレイのゲームに焦点を絞ったが,我々は,小規模エージェントと匿名エージェントからなる大規模集団の戦略的相互作用をモデル化した人口ゲームを考える。
本稿では,報奨信号に基づいて推論を行う独立学習エージェントの確率過程とダイナミクスの形式的関係について述べる。
マスター方程式を用いて,単一偏微分方程式 (theorem 1) による個体群動態を特徴付ける新しい統一フレームワークを提案する。
クロスラーニングエージェントを含むケーススタディを通じて、定理1は定性的に異なる進化のダイナミクスを識別し、定常状態を分析し、人口の期待された行動に対する洞察を得ることを可能にする。
さらに,Theorem 1が様々な学習方法や集団ゲームに有効であることを示す広範な実験結果を示す。
関連論文リスト
- Evolution with Opponent-Learning Awareness [10.689403855269704]
学習エージェントの多種多様な集団が通常のゲームでどのように進化するかを示す。
進化シミュレーションに適した対向学習意識の高速で並列化可能な実装を導出する。
我々は,Hawk-Dove,Stag-Hunt,Rock-Paper-Scissorsの古典ゲームにおいて,20万エージェントのシミュレーションでアプローチを実証した。
論文 参考訳(メタデータ) (2024-10-22T22:49:04Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Mathematics of multi-agent learning systems at the interface of game
theory and artificial intelligence [0.8049333067399385]
進化ゲーム理論と人工知能は、一見すると異なるように見える2つの分野であるが、それらは顕著なつながりと交差を持っている。
前者は集団における行動(または戦略)の進化に焦点を当て、個人が他人と対話し、模倣(または社会学習)に基づいて戦略を更新する。
一方後者は、機械学習アルゴリズムと(ディープ)ニューラルネットワークに重点を置いている。
論文 参考訳(メタデータ) (2024-03-09T17:36:54Z) - DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Decentralized Adversarial Training over Graphs [55.28669771020857]
機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。
この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文 参考訳(メタデータ) (2023-03-23T15:05:16Z) - Learning signatures of decision making from many individuals playing the
same game [54.33783158658077]
我々は、個人の「行動スタイル」を符号化する表現を学習する予測フレームワークを設計する。
我々は,3本腕のバンディットタスクを行う1,000人の人間による大規模行動データセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-02-21T21:41:53Z) - Independent Learning in Stochastic Games [16.505046191280634]
動的環境におけるマルチエージェント学習のためのゲームモデルを提案する。
ゲームのためのシンプルで独立した学習力学の開発に焦点をあてる。
我々は最近提案したゼロサムゲームにおける収束を保証する単純かつ独立な学習力学について述べる。
論文 参考訳(メタデータ) (2021-11-23T09:27:20Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Evolutionary Strategies with Analogy Partitions in p-guessing Games [0.0]
不安定なpゲーム環境における学習のダイナミクスを研究するために,学習の進化過程を導入する。
我々の遺伝的アルゴリズムは、ナッシュ平衡に収束して、持続的な環境における過去の結果と一貫して振る舞うことを示す。
論文 参考訳(メタデータ) (2021-03-26T10:28:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。