論文の概要: Game Theory with Simulation in the Presence of Unpredictable Randomisation
- arxiv url: http://arxiv.org/abs/2410.14311v1
- Date: Fri, 18 Oct 2024 09:17:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:24:33.316510
- Title: Game Theory with Simulation in the Presence of Unpredictable Randomisation
- Title(参考訳): 予測不可能なランダム化の存在下でのシミュレーションによるゲーム理論
- Authors: Vojtech Kovarik, Nathaniel Sauerberg, Lewis Hammond, Vincent Conitzer,
- Abstract要約: そこで我々は,あるエージェントが,その混合戦略を学習するために,一方のエージェントが他方のエージェントをシミュレートするために固定費用を支払うことができるゲーム理論の環境で,その問題を研究する。
純粋ストラテジーシミュレーションの先行研究とは対照的に、混合ストラテジーシミュレーションが両プレイヤーに改善をもたらすことはないことを証明した。
我々は,シミュレータが信頼レベルを拡大するオプションがある場合,混合戦略シミュレーションは社会福祉を改善することができることを確認した。
- 参考スコア(独自算出の注目度): 22.216141581645115
- License:
- Abstract: AI agents will be predictable in certain ways that traditional agents are not. Where and how can we leverage this predictability in order to improve social welfare? We study this question in a game-theoretic setting where one agent can pay a fixed cost to simulate the other in order to learn its mixed strategy. As a negative result, we prove that, in contrast to prior work on pure-strategy simulation, enabling mixed-strategy simulation may no longer lead to improved outcomes for both players in all so-called "generalised trust games". In fact, mixed-strategy simulation does not help in any game where the simulatee's action can depend on that of the simulator. We also show that, in general, deciding whether simulation introduces Pareto-improving Nash equilibria in a given game is NP-hard. As positive results, we establish that mixed-strategy simulation can improve social welfare if the simulator has the option to scale their level of trust, if the players face challenges with both trust and coordination, or if maintaining some level of privacy is essential for enabling cooperation.
- Abstract(参考訳): AIエージェントは、従来のエージェントがそうでない特定の方法で予測可能である。
社会福祉を改善するために、どのようにしてこの予測可能性を活用することができるのか?
本研究では,あるエージェントが,その混合戦略を学習するために,一方のエージェントが他方のエージェントをシミュレートするために固定費用を支払うことができるゲーム理論環境で,この問題を研究する。
否定的な結果として、純粋ストラテジーシミュレーションの先行研究とは対照的に、混合ストラテジーシミュレーションは「汎用信頼ゲーム」と呼ばれる全てのプレイヤーにおいて、もはや両プレイヤーの成績改善に繋がらないことが証明された。
実際、混合戦略シミュレーションはシミュレートの動作がシミュレータの動作に依存するようなゲームでは役に立たない。
また、一般に、シミュレーションが与えられたゲームにおいてパレート改善ナッシュ平衡を導入するかどうかを決定することはNPハードであることを示す。
肯定的な結果として,シミュレータが信頼レベルを拡大するオプションがある場合や,プレイヤーが信頼と調整の両面で課題に直面している場合,あるいはある程度のプライバシを維持することが協力の実現に不可欠である場合,混合戦略シミュレーションが社会福祉を改善することが確認された。
関連論文リスト
- A Simulation System Towards Solving Societal-Scale Manipulation [14.799498804818333]
AIによる操作の台頭は、社会的信頼と民主的プロセスに重大なリスクをもたらす。
しかし、これらの効果を現実世界で大規模に研究することは倫理的にも論理的にも非現実的です。
この問題に対処するために設計されたシミュレーション環境を提案する。
論文 参考訳(メタデータ) (2024-10-17T03:16:24Z) - GenSim: A General Social Simulation Platform with Large Language Model based Agents [111.00666003559324]
我々はtextitGenSim と呼ばれる新しい大規模言語モデル (LLM) ベースのシミュレーションプラットフォームを提案する。
我々のプラットフォームは10万のエージェントをサポートし、現実世界のコンテキストで大規模人口をシミュレートする。
我々の知る限り、GenSimは汎用的で大規模で修正可能な社会シミュレーションプラットフォームに向けた最初の一歩である。
論文 参考訳(メタデータ) (2024-10-06T05:02:23Z) - Recursive Joint Simulation in Games [31.83449293345303]
AIエージェント間のゲーム理論のダイナミクスは、従来の人間と人間の相互作用とは異なる可能性がある。
そのような違いの1つは、例えばソースコードが知られているため、AIエージェントを正確にシミュレートすることができることである。
得られた相互作用は、元のゲームの無限に繰り返されるバージョンと戦略的に等価であることを示す。
論文 参考訳(メタデータ) (2024-02-12T23:53:46Z) - Neural Population Learning beyond Symmetric Zero-sum Games [52.20454809055356]
我々はNuPL-JPSROという,スキルの伝達学習の恩恵を受けるニューラル集団学習アルゴリズムを導入し,ゲームの粗相関(CCE)に収束する。
本研究は, 均衡収束型集団学習を大規模かつ汎用的に実施可能であることを示す。
論文 参考訳(メタデータ) (2024-01-10T12:56:24Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Provably Efficient Fictitious Play Policy Optimization for Zero-Sum
Markov Games with Structured Transitions [145.54544979467872]
本研究では,ゼロサムマルコフゲームに対して,構造的だが未知の遷移を伴う架空のプレイポリシー最適化アルゴリズムを提案し,解析する。
我々は、2年制の競争ゲームシナリオで、$K$のエピソードに続き、$widetildemathcalO(sqrtK)$ regret boundsを証明した。
提案アルゴリズムは,アッパー信頼境界(UCB)型最適化と,同時政策最適化の範囲内での架空のプレイの組み合わせを特徴とする。
論文 参考訳(メタデータ) (2022-07-25T18:29:16Z) - Deep Learning-based Spatially Explicit Emulation of an Agent-Based
Simulator for Pandemic in a City [0.6875312133832077]
エージェントベースモデルは、都市におけるパンデミックの拡散など、物理的または社会的プロセスのシミュレーションに有用である。
このようなモデルは計算には非常に高価であり、複雑度はしばしばエージェントの総数で線形である。
本稿では,エージェントベースモデルを高精度にエミュレート可能なDilated Convolutional Neural Networkに基づくディープラーニングモデルについて論じる。
論文 参考訳(メタデータ) (2022-05-28T10:56:37Z) - On the Verge of Solving Rocket League using Deep Reinforcement Learning
and Sim-to-sim Transfer [42.87143421242222]
この研究は、ロボット工学で確立された第3の方法、すなわちsim-to-realトランスファーを探求する。
Rocket Leagueの場合、Deep Reinforcement Learningを用いてゴールキーパーとストライカーの単一動作を学習できることを実証する。
論文 参考訳(メタデータ) (2022-05-10T17:37:19Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。