論文の概要: Evaluating and Rewarding Teamwork Using Cooperative Game Abstractions
- arxiv url: http://arxiv.org/abs/2006.09538v1
- Date: Tue, 16 Jun 2020 22:03:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 20:30:16.616929
- Title: Evaluating and Rewarding Teamwork Using Cooperative Game Abstractions
- Title(参考訳): 協調ゲーム抽象化を用いたチームワークの評価とリワード
- Authors: Tom Yan, Christian Kroer, Alexander Peysakhovich
- Abstract要約: 我々は、協調ゲーム理論を用いて、プロスポーツから、人工RLエージェントのチームと現実世界のチームを研究する。
データからCFを推定するための協調ゲーム抽象化(CGA)と呼ばれるパラメトリックモデルを導入する。
CGAモデルに対する識別結果とサンプル境界の複雑さと、CGAを用いたShapley値の推定における誤差境界を提供する。
- 参考スコア(独自算出の注目度): 103.3630903577951
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Can we predict how well a team of individuals will perform together? How
should individuals be rewarded for their contributions to the team performance?
Cooperative game theory gives us a powerful set of tools for answering these
questions: the Characteristic Function (CF) and solution concepts like the
Shapley Value (SV). There are two major difficulties in applying these
techniques to real world problems: first, the CF is rarely given to us and
needs to be learned from data. Second, the SV is combinatorial in nature. We
introduce a parametric model called cooperative game abstractions (CGAs) for
estimating CFs from data. CGAs are easy to learn, readily interpretable, and
crucially allow linear-time computation of the SV. We provide identification
results and sample complexity bounds for CGA models as well as error bounds in
the estimation of the SV using CGAs. We apply our methods to study teams of
artificial RL agents as well as real world teams from professional sports.
- Abstract(参考訳): 個人のチームがどれだけうまく働くかを予測できますか?
チームパフォーマンスへの貢献に対して、個人はどのように報われるべきか?
協調ゲーム理論は、特徴関数(CF)とShapley Value(SV)のようなソリューション概念という、これらの質問に答えるための強力なツールセットを提供する。
まず、CFは私たちにはほとんど与えられず、データから学ぶ必要がある。
第二に、svは自然界における組合せである。
データからCFを推定するための協調ゲーム抽象化(CGA)と呼ばれるパラメトリックモデルを導入する。
CGAは容易に学習でき、容易に解釈でき、SVの線形時間計算を可能にする。
CGAモデルに対する識別結果とサンプル複雑性境界、およびCGAを用いたSVの推定における誤差境界を提供する。
我々は,人工RLエージェントのチームと,プロスポーツの現実世界チームの研究に本手法を適用した。
関連論文リスト
- Open Ad Hoc Teamwork with Cooperative Game Theory [28.605478081031215]
アドホックなチームワークは、事前の調整や共同トレーニングなしに、チームメイトと協力するエージェントの設計を必要とする、困難な問題を引き起こします。
有望な解決策の1つは、制限のない数のエージェントを扱うためにグラフニューラルネットワークの一般化性を活用することである。
本稿では,ゲームフレームワークをベースとしたCIAOという新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-23T11:04:33Z) - SMaRt: Improving GANs with Score Matching Regularity [94.81046452865583]
生成的敵ネットワーク(GAN)は通常、基礎となる多様体が複雑である非常に多様なデータから学ぶのに苦労する。
スコアマッチングは、生成したデータポイントを実データ多様体へ持続的にプッシュする能力のおかげで、この問題に対する有望な解決策であることを示す。
スコアマッチング規則性(SMaRt)を用いたGANの最適化を提案する。
論文 参考訳(メタデータ) (2023-11-30T03:05:14Z) - A General Learning Framework for Open Ad Hoc Teamwork Using Graph-based
Policy Learning [11.998708550268978]
完全かつ部分的な可観測性の下でオープンなアドホックチームワークのためのソリューションのクラスを開発する。
我々のソリューションは、オープンなアドホックチームワークにおいて、完全かつ部分的に観察可能なケースで効率的なポリシーを学習できることを示します。
論文 参考訳(メタデータ) (2022-10-11T13:44:44Z) - Neural Payoff Machines: Predicting Fair and Stable Payoff Allocations
Among Team Members [13.643650155415484]
ニューラルネットワークをトレーニングすることで,協調的なゲーム理論解を学習モデルに蒸留する方法を示す。
我々の手法はトレーニング分布から遠く離れたゲームに一般化できるモデルを作成する。
私たちのフレームワークの重要な応用は、説明可能なAIです。
論文 参考訳(メタデータ) (2022-08-18T12:33:09Z) - Towards convergence to Nash equilibria in two-team zero-sum games [17.4461045395989]
2チームゼロサムゲームは、プレイヤーが2つの競合するエージェントに分割されるマルチプレイヤーゲームとして定義される。
我々はNash equilibria(NE)の解の概念に焦点をあてる。
このクラスのゲームに対する計算 NE は、複雑性クラス $mathrm$ に対して $textithard$ であることを示す。
論文 参考訳(メタデータ) (2021-11-07T21:15:35Z) - Multi-task Learning of Order-Consistent Causal Graphs [59.9575145128345]
我々は、$K関連ガウス非巡回グラフ(DAG)の発見問題を考える。
マルチタスク学習環境下では, 線形構造方程式モデルを学習するためのMLE ($l_1/l$-regularized maximum chance estimator) を提案する。
理論的には、関係するタスクにまたがるデータを活用することで、因果順序を復元する際のサンプルの複雑さをより高めることができることを示す。
論文 参考訳(メタデータ) (2021-11-03T22:10:18Z) - An Empirical Study on the Generalization Power of Neural Representations
Learned via Visual Guessing Games [79.23847247132345]
本研究は,視覚質問応答(VQA)のような新しいNLP下流タスクにおいて,後から実行を依頼されたとき,人工エージェントが推測ゲームでどの程度の利益を得ることができるかを検討する。
提案手法は,1) エージェントがうまく推理ゲームを模倣することを学習する教師あり学習シナリオ,2) エージェントが単独でプレイする新しい方法,すなわち,反復経験学習(SPIEL)によるセルフプレイ(Self-play)を提案する。
論文 参考訳(メタデータ) (2021-01-31T10:30:48Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Finding Core Members of Cooperative Games using Agent-Based Modeling [0.0]
エージェント・ベース・モデリング(ABM)は、社会現象の洞察を得るための強力なパラダイムである。
本稿では,エージェントが連立関係を見つけられるように,AIMに組み込むアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-08-30T17:38:43Z) - Unshuffling Data for Improved Generalization [65.57124325257409]
トレーニングディストリビューションを越えた一般化は、マシンラーニングにおける中核的な課題である。
本研究では,複数の学習環境として扱われる非d.d.サブセットにデータを分割することで,アウト・オブ・ディストリビューションの一般化を向上したモデル学習を導出できることを示す。
論文 参考訳(メタデータ) (2020-02-27T03:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。