論文の概要: Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and
Practice
- arxiv url: http://arxiv.org/abs/2102.05008v1
- Date: Tue, 9 Feb 2021 18:20:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-10 14:53:43.058550
- Title: Equilibrium Refinements for Multi-Agent Influence Diagrams: Theory and
Practice
- Title(参考訳): マルチエージェント影響図の平衡再定義:理論と実践
- Authors: Lewis Hammond, James Fox, Tom Everitt, Alessandro Abate, Michael
Wooldridge
- Abstract要約: マルチエージェント・インフルエンス・ダイアグラム(MAID)はグラフィカル・モデルの一般的な形式であり、特定のクラスのゲームに対して、従来の拡張形式ゲーム(EFG)表現よりも重要な複雑さと説明可能性の利点が示されている。
我々は、MAIDサブゲームの概念を導入し、サブゲームパーフェクトとハンドパーフェクトの均衡改善を導入することで、MAIDに関する以前の研究を拡張した。
- 参考スコア(独自算出の注目度): 62.58588499193303
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent influence diagrams (MAIDs) are a popular form of graphical model
that, for certain classes of games, have been shown to offer key complexity and
explainability advantages over traditional extensive form game (EFG)
representations. In this paper, we extend previous work on MAIDs by introducing
the concept of a MAID subgame, as well as subgame perfect and trembling hand
perfect equilibrium refinements. We then prove several equivalence results
between MAIDs and EFGs. Finally, we describe an open source implementation for
reasoning about MAIDs and computing their equilibria.
- Abstract(参考訳): マルチエージェント・インフルエンス・ダイアグラム(MAID)はグラフィカル・モデルの一般的な形式であり、特定のクラスのゲームに対して、従来の拡張形式ゲーム(EFG)表現よりも重要な複雑さと説明可能性の利点が示されている。
本論文では、MAIDサブゲームの概念、およびサブゲームパーフェクトおよびトレムブルハンドパーフェクトバランスの洗練について紹介することにより、MAIDに関するこれまでの研究を拡張します。
次に、MAIDとEFG間のいくつかの等価結果を証明する。
最後に,MAIDの推論と平衡計算のためのオープンソース実装について述べる。
関連論文リスト
- Diversifying the Mixture-of-Experts Representation for Language Models
with Orthogonal Optimizer [62.41501243027603]
The Mixture of Experts (MoE)は、ディープラーニングにおいて非常に成功したテクニックとして登場した。
本研究では,MoEの専門家が多様性の専門化や欠如に失敗した同質表現問題に光を当てた。
我々は,エキスパートエンティティであるOMoEという,単純かつ高効率なソリューションを提案する。
論文 参考訳(メタデータ) (2023-10-15T07:20:28Z) - MinT: Boosting Generalization in Mathematical Reasoning via Multi-View
Fine-Tuning [53.90744622542961]
数学領域における推論は、小言語モデル(LM)にとって重要な課題である。
多様なアノテーションスタイルで既存の数学的問題データセットを利用する新しい手法を提案する。
実験結果から,LLaMA-7Bモデルが先行手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-16T05:41:53Z) - On Imperfect Recall in Multi-Agent Influence Diagrams [57.21088266396761]
マルチエージェント・インフルエンス・ダイアグラム(MAID)はベイズネットワークに基づくゲーム理論モデルとして人気がある。
混合ポリシと2種類の相関平衡を用いて, 忘れ易いエージェントと不注意なエージェントでMAIDを解く方法を示す。
また,不完全なリコールがしばしば避けられないマルコフゲームやチーム状況へのMAIDの適用についても述べる。
論文 参考訳(メタデータ) (2023-07-11T07:08:34Z) - Understanding Masked Autoencoders via Hierarchical Latent Variable
Models [109.35382136147349]
Masked Autoencoder (MAE) は近年,様々な視覚タスクにおいて顕著な成功を収めている。
MAEに関する興味深い経験的観察の出現にもかかわらず、理論的に原理化された理解はいまだに欠如している。
論文 参考訳(メタデータ) (2023-06-08T03:00:10Z) - Mean Field Games on Weighted and Directed Graphs via Colored Digraphons [26.405495663998828]
グラフィオン平均場ゲーム(GMFGs)は、学習問題に対するスケーラブルで数学的に確立されたアプローチを提供する。
本稿では,エージェント間の重み付けと方向付けが可能なカラーディクソン平均フィールドゲーム(CDMFG)について紹介する。
論文 参考訳(メタデータ) (2022-09-08T15:45:20Z) - Scaling up Mean Field Games with Online Mirror Descent [55.36153467919289]
オンラインミラー Descent (OMD) を用いた平均場ゲーム (MFG) のスケールアップ均衡計算に対処する。
連続時間 OMD は自然かつモチベーションの良い単調性仮定の集合の下でナッシュ平衡に確実に収束することを示す。
様々な単一および多集団MFGに関する徹底的な実験的研究は、OMDがFictitious Play (FP)のような従来のアルゴリズムより優れていることを示している。
論文 参考訳(メタデータ) (2021-02-28T21:28:36Z) - Large-Scale Multi-Agent Deep FBSDEs [28.525065041507982]
架空のプレイを用いたマルチエージェントゲームにおいてマルコフ的ナッシュ平衡を求めるためのフレームワークを提案する。
我々は,現在最先端のディープラーニングプレイアルゴリズムに対して,我々のフレームワークの優れた性能を示す。
また,ロボット工学における我々のフレームワークの適用性を,信仰空間における自律レース問題に適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-11-21T23:00:50Z) - Replication Robust Payoff Allocation in Submodular Cooperative Games [16.328395329867178]
情報や冗長性といった概念をモデル化するための機械学習(ML)では,サブモジュール関数がますます重要になっている。
サブモジュールゲームにおけるレプリケーション操作について検討し、レプリケーションに対するソリューション概念のロバスト性を測定する指標であるレプリケーションロバスト性について検討する。
論文 参考訳(メタデータ) (2020-06-25T17:30:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。