論文の概要: Recursive Joint Simulation in Games
- arxiv url: http://arxiv.org/abs/2402.08128v1
- Date: Mon, 12 Feb 2024 23:53:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-14 17:22:43.431402
- Title: Recursive Joint Simulation in Games
- Title(参考訳): ゲームにおける再帰的ジョイントシミュレーション
- Authors: Vojtech Kovarik, Caspar Oesterheld, Vincent Conitzer
- Abstract要約: AIエージェント間のゲーム理論のダイナミクスは、従来の人間と人間の相互作用とは異なる可能性がある。
そのような違いの1つは、例えばソースコードが知られているため、AIエージェントを正確にシミュレートすることができることである。
得られた相互作用は、元のゲームの無限に繰り返されるバージョンと戦略的に等価であることを示す。
- 参考スコア(独自算出の注目度): 31.83449293345303
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Game-theoretic dynamics between AI agents could differ from traditional
human-human interactions in various ways. One such difference is that it may be
possible to accurately simulate an AI agent, for example because its source
code is known. Our aim is to explore ways of leveraging this possibility to
achieve more cooperative outcomes in strategic settings. In this paper, we
study an interaction between AI agents where the agents run a recursive joint
simulation. That is, the agents first jointly observe a simulation of the
situation they face. This simulation in turn recursively includes additional
simulations (with a small chance of failure, to avoid infinite recursion), and
the results of all these nested simulations are observed before an action is
chosen. We show that the resulting interaction is strategically equivalent to
an infinitely repeated version of the original game, allowing a direct transfer
of existing results such as the various folk theorems.
- Abstract(参考訳): AIエージェント間のゲーム理論のダイナミクスは、様々な方法で従来の人間と人間の相互作用とは異なる可能性がある。
そのような違いの1つは、例えばソースコードが知られているため、AIエージェントを正確にシミュレートすることができることである。
我々の目標は、この可能性を活用して、戦略的設定においてより協力的な結果を達成する方法を探ることである。
本稿では,エージェントが再帰的関節シミュレーションを行うAIエージェント間の相互作用について検討する。
つまり、エージェントはまず、彼らが直面する状況のシミュレーションを共同で観察する。
このシミュレーションは再帰的に追加のシミュレーション(小さな失敗の確率で、無限の再帰を避ける)を含み、これらのネストされたシミュレーションの結果は、アクションが選択される前に観察される。
得られた相互作用は、元のゲームの無限に繰り返されるバージョンと戦略的に等価であることを示し、様々な民間定理のような既存の結果を直接転送できるようにする。
関連論文リスト
- Game Theory with Simulation in the Presence of Unpredictable Randomisation [22.216141581645115]
そこで我々は,あるエージェントが,その混合戦略を学習するために,一方のエージェントが他方のエージェントをシミュレートするために固定費用を支払うことができるゲーム理論の環境で,その問題を研究する。
純粋ストラテジーシミュレーションの先行研究とは対照的に、混合ストラテジーシミュレーションが両プレイヤーに改善をもたらすことはないことを証明した。
我々は,シミュレータが信頼レベルを拡大するオプションがある場合,混合戦略シミュレーションは社会福祉を改善することができることを確認した。
論文 参考訳(メタデータ) (2024-10-18T09:17:18Z) - On a Connection between Differential Games, Optimal Control, and
Energy-based Models for Multi-Agent Interactions [0.13499500088995461]
差分ゲーム,最適制御,エネルギーベースモデルの関連性を示す。
この定式化に基づいて、この研究はエンド・ツー・エンドの学習アプリケーションを導入している。
シミュレーションされた移動ロボット歩行者インタラクションと実世界の自動運転データを用いた実験は、実証的な証拠を提供する。
論文 参考訳(メタデータ) (2023-08-31T08:30:11Z) - Endogenous Macrodynamics in Algorithmic Recourse [52.87956177581998]
対実説明(CE)とアルゴリズム・リコース(AR)に関する既存の研究は、静的環境における個人に主に焦点を当ててきた。
既存の方法論の多くは、一般化されたフレームワークによってまとめて記述できることを示す。
次に、既存のフレームワークは、グループレベルでの言論の内在的ダイナミクスを研究する際にのみ明らかとなるような、隠された対外的関係のコストを考慮に入れていないと論じる。
論文 参考訳(メタデータ) (2023-08-16T07:36:58Z) - Exploring the Intersection of Large Language Models and Agent-Based
Modeling via Prompt Engineering [0.0]
大きな言語モデル(LLM)がこのボトルネックの潜在的な解決策として現れている。
本稿では,人間行動の予測可能なプロキシのシミュレーションを2つ提示する。
論文 参考訳(メタデータ) (2023-08-14T18:58:00Z) - User Behavior Simulation with Large Language Model based Agents [116.74368915420065]
LLMベースのエージェントフレームワークを提案し,実際のユーザ動作をシミュレートするサンドボックス環境を設計する。
実験結果から,本手法のシミュレーション行動は実人の行動に非常に近いことが判明した。
論文 参考訳(メタデータ) (2023-06-05T02:58:35Z) - Deep Learning-based Spatially Explicit Emulation of an Agent-Based
Simulator for Pandemic in a City [0.6875312133832077]
エージェントベースモデルは、都市におけるパンデミックの拡散など、物理的または社会的プロセスのシミュレーションに有用である。
このようなモデルは計算には非常に高価であり、複雑度はしばしばエージェントの総数で線形である。
本稿では,エージェントベースモデルを高精度にエミュレート可能なDilated Convolutional Neural Networkに基づくディープラーニングモデルについて論じる。
論文 参考訳(メタデータ) (2022-05-28T10:56:37Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - RoboTHOR: An Open Simulation-to-Real Embodied AI Platform [56.50243383294621]
インタラクティブで具体化された視覚AIの研究を民主化するためにRoboTHORを導入する。
シミュレーションで訓練されたモデルの性能は,シミュレーションと慎重に構築された物理アナログの両方で試験される場合,大きな差があることが示される。
論文 参考訳(メタデータ) (2020-04-14T20:52:49Z) - Model-Based Reinforcement Learning for Atari [89.3039240303797]
エージェントがモデルフリーの手法よりも少ないインタラクションでAtariゲームを解くことができることを示す。
本実験は,エージェントと環境間の100kの相互作用の少ないデータ構造における,AtariゲームにおけるSimPLeの評価である。
論文 参考訳(メタデータ) (2019-03-01T15:40:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。