論文の概要: Neural Payoff Machines: Predicting Fair and Stable Payoff Allocations
Among Team Members
- arxiv url: http://arxiv.org/abs/2208.08798v1
- Date: Thu, 18 Aug 2022 12:33:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-19 13:20:55.899358
- Title: Neural Payoff Machines: Predicting Fair and Stable Payoff Allocations
Among Team Members
- Title(参考訳): ニューラルペイオフマシン: チームメンバ間の公平かつ安定したペイオフアロケーションの予測
- Authors: Daphne Cornelisse, Thomas Rood, Mateusz Malinowski, Yoram Bachrach,
and Tal Kachman
- Abstract要約: ニューラルネットワークをトレーニングすることで,協調的なゲーム理論解を学習モデルに蒸留する方法を示す。
我々の手法はトレーニング分布から遠く離れたゲームに一般化できるモデルを作成する。
私たちのフレームワークの重要な応用は、説明可能なAIです。
- 参考スコア(独自算出の注目度): 13.643650155415484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many multi-agent settings, participants can form teams to achieve
collective outcomes that may far surpass their individual capabilities.
Measuring the relative contributions of agents and allocating them shares of
the reward that promote long-lasting cooperation are difficult tasks.
Cooperative game theory offers solution concepts identifying distribution
schemes, such as the Shapley value, that fairly reflect the contribution of
individuals to the performance of the team or the Core, which reduces the
incentive of agents to abandon their team. Applications of such methods include
identifying influential features and sharing the costs of joint ventures or
team formation. Unfortunately, using these solutions requires tackling a
computational barrier as they are hard to compute, even in restricted settings.
In this work, we show how cooperative game-theoretic solutions can be distilled
into a learned model by training neural networks to propose fair and stable
payoff allocations. We show that our approach creates models that can
generalize to games far from the training distribution and can predict
solutions for more players than observed during training. An important
application of our framework is Explainable AI: our approach can be used to
speed-up Shapley value computations on many instances.
- Abstract(参考訳): 多くのマルチエージェント設定では、参加者はチームを作り、個々の能力をはるかに超えるような集合的な成果を達成できます。
エージェントの相対的な貢献を計測し、長期的な協力を促進する報酬の共有を割り当てることは難しい。
協調ゲーム理論は、Shapley値のような分散スキームを識別するソリューション概念を提供し、それは、チームやコアのパフォーマンスに対する個人の貢献をかなり反映している。
このような方法の応用には、影響力のある特徴を特定し、ジョイントベンチャーやチーム形成のコストを共有することが含まれる。
残念ながら、これらのソリューションを使用するには、制限された設定でも計算が難しいため、計算障壁に取り組む必要がある。
そこで本研究では,ニューラルネットワークの学習により学習モデルに協調的なゲーム理論解を蒸留し,公平かつ安定した報酬配分を提案する。
提案手法は,トレーニング分布から離れたゲームに一般化可能なモデルを作成し,トレーニング中に観測されるよりも多くのプレイヤーに対する解を予測できることを示す。
私たちのアプローチは、多くのインスタンスにおけるShapley値計算の高速化に使用できます。
関連論文リスト
- TeamLoRA: Boosting Low-Rank Adaptation with Expert Collaboration and Competition [61.91764883512776]
我々は,専門家のためのコラボレーション・コンペティション・モジュールからなる,革新的なPEFT手法であるTeamLoRAを紹介する。
そうすることで、TeamLoRAは専門家を"チーム"として内部のコラボレーションや競争に結び付け、マルチタスク学習のためのより高速で正確なPEFTパラダイムを可能にします。
論文 参考訳(メタデータ) (2024-08-19T09:58:53Z) - Cooperation Dynamics in Multi-Agent Systems: Exploring Game-Theoretic Scenarios with Mean-Field Equilibria [0.0]
本稿では,ゲーム理論のシナリオ,すなわちIterated Prisoner's Dilemmaにおける協調を呼び起こす戦略について検討する。
既存の協調戦略は、繰り返しゲームにおけるグループ指向行動を促進する効果について分析する。
この研究は、指数関数的に増加するエージェント集団のシナリオにまで及んでいる。
論文 参考訳(メタデータ) (2023-09-28T08:57:01Z) - Multi-Agent Neural Rewriter for Vehicle Routing with Limited Disclosure
of Costs [65.23158435596518]
チームのマルコフゲームとして、部分的に観測可能なコストでマルチサイクルルーティング問題を解く。
我々のマルチエージェント強化学習アプローチである、いわゆるマルチエージェントニューラルリライタは、1エージェントニューラルリライタを利用して、反復的に書き換えるソリューションによって問題を解決する。
論文 参考訳(メタデータ) (2022-06-13T09:17:40Z) - Offsetting Unequal Competition through RL-assisted Incentive Schemes [18.57907480363166]
本稿では,不平等な専門知識を持つ組織間の競争のダイナミクスについて検討する。
We design Touch-Mark, a game based on well-known multi-agent- Particle-environment。
論文 参考訳(メタデータ) (2022-01-05T04:47:22Z) - Secure Distributed Training at Scale [65.7538150168154]
ピアの存在下でのトレーニングには、ビザンティン寛容な特殊な分散トレーニングアルゴリズムが必要である。
本稿では,コミュニケーション効率を重視したセキュアな(ビザンチン耐性)分散トレーニングのための新しいプロトコルを提案する。
論文 参考訳(メタデータ) (2021-06-21T17:00:42Z) - Distributed Deep Learning in Open Collaborations [49.240611132653456]
協調学習に特化して設計された新しいアルゴリズムフレームワークを提案する。
現実的な条件下でのSwaVとALBERTの事前学習に対するアプローチの有効性を実証し,コストのごく一部で従来の設定に匹敵する性能を実現する。
論文 参考訳(メタデータ) (2021-06-18T16:23:13Z) - Faster Algorithms for Optimal Ex-Ante Coordinated Collusive Strategies
in Extensive-Form Zero-Sum Games [123.76716667704625]
我々は,不完全情報ゼロサム拡張形式ゲームにおいて,対戦相手と対決する2人の選手のチームにとって最適な戦略を見つけることの課題に焦点をあてる。
この設定では、チームができる最善のことは、ゲーム開始時の関節(つまり相関した)確率分布から潜在的にランダム化された戦略(プレイヤー1人)のプロファイルをサンプリングすることである。
各プロファイルにランダム化されるのはチームメンバーの1人だけであるプロファイルのみを用いることで、そのような最適な分布を計算するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-21T17:51:57Z) - Towards Open Ad Hoc Teamwork Using Graph-based Policy Learning [11.480994804659908]
我々は、さまざまなチーム構成の下でエージェントモデルと共同アクション値モデルを学ぶために、グラフニューラルネットワーク上に構築する。
私たちは、我々のアプローチが、他のエージェントが学習者に与える影響をうまくモデル化し、動的なチーム構成にしっかりと適応するポリシーを導いたことを実証的に実証します。
論文 参考訳(メタデータ) (2020-06-18T10:39:41Z) - Evaluating and Rewarding Teamwork Using Cooperative Game Abstractions [103.3630903577951]
我々は、協調ゲーム理論を用いて、プロスポーツから、人工RLエージェントのチームと現実世界のチームを研究する。
データからCFを推定するための協調ゲーム抽象化(CGA)と呼ばれるパラメトリックモデルを導入する。
CGAモデルに対する識別結果とサンプル境界の複雑さと、CGAを用いたShapley値の推定における誤差境界を提供する。
論文 参考訳(メタデータ) (2020-06-16T22:03:36Z) - A Stochastic Team Formation Approach for Collaborative Mobile
Crowdsourcing [1.4209473797379666]
我々は,SN隣人に関する労働者の知識を活用するアルゴリズムを開発し,特定のリーダーに適切なチームを募集するよう依頼する。
提案アルゴリズムは最適な停止戦略から着想を得て,オッズアルゴリズムを用いて出力を算出する。
実験結果から, ベンチマーク指数最適解と比較して, 提案手法は時間を短縮し, 妥当な性能が得られることがわかった。
論文 参考訳(メタデータ) (2020-04-28T22:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。