論文の概要: Modelling Cooperation in Network Games with Spatio-Temporal Complexity
- arxiv url: http://arxiv.org/abs/2102.06911v1
- Date: Sat, 13 Feb 2021 12:04:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:32:00.131286
- Title: Modelling Cooperation in Network Games with Spatio-Temporal Complexity
- Title(参考訳): 時空間複雑性を伴うネットワークゲームにおけるモデリング協調
- Authors: Michiel A. Bakker, Richard Everett, Laura Weidinger, Iason Gabriel,
William S. Isaac, Joel Z. Leibo, Edward Hughes
- Abstract要約: 複雑なグリッドワールドドメインにおける自己組織化協調の出現について検討する。
マルチエージェント深層強化学習を用いて,エージェント・ソサエティの多種多様なメカニズムをシミュレートした。
本手法は,人間および人工エージェントシステムにおける機構設計に影響を及ぼす。
- 参考スコア(独自算出の注目度): 11.665246332943058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The real world is awash with multi-agent problems that require collective
action by self-interested agents, from the routing of packets across a computer
network to the management of irrigation systems. Such systems have local
incentives for individuals, whose behavior has an impact on the global outcome
for the group. Given appropriate mechanisms describing agent interaction,
groups may achieve socially beneficial outcomes, even in the face of short-term
selfish incentives. In many cases, collective action problems possess an
underlying graph structure, whose topology crucially determines the
relationship between local decisions and emergent global effects. Such
scenarios have received great attention through the lens of network games.
However, this abstraction typically collapses important dimensions, such as
geometry and time, relevant to the design of mechanisms promoting cooperation.
In parallel work, multi-agent deep reinforcement learning has shown great
promise in modelling the emergence of self-organized cooperation in complex
gridworld domains. Here we apply this paradigm in graph-structured collective
action problems. Using multi-agent deep reinforcement learning, we simulate an
agent society for a variety of plausible mechanisms, finding clear transitions
between different equilibria over time. We define analytic tools inspired by
related literatures to measure the social outcomes, and use these to draw
conclusions about the efficacy of different environmental interventions. Our
methods have implications for mechanism design in both human and artificial
agent systems.
- Abstract(参考訳): 現実の世界は、コンピュータネットワークを横断するパケットのルーティングから灌水システムの管理まで、自己関心のエージェントによる集団行動を必要とするマルチエージェントの問題に悩まされている。
このようなシステムは個人に対して局所的なインセンティブを持ち、その行動がグループ全体の成果に影響を及ぼす。
エージェントの相互作用を記述する適切なメカニズムを考えると、グループは短期的な利己的なインセンティブに直面しても社会的に有益な結果を得ることができる。
多くの場合、集合的な行動問題はグラフ構造を持ち、そのトポロジーは局所的な決定と創発的なグローバル効果の関係を決定づける。
このようなシナリオはネットワークゲームのレンズを通して大きな注目を集めている。
しかし、この抽象化は通常、協力を促進するメカニズムの設計に関連する幾何学や時間などの重要な寸法を崩壊させる。
並列的な作業では、複雑なグリッドワールドドメインにおける自己組織化協調の出現をモデル化する上で、マルチエージェントの深層強化学習が大きな可能性を示している。
ここでは,このパラダイムをグラフ構造集団行動問題に適用する。
エージェント・ソサイエティを多エージェント深層強化学習を用いて多種多様なメカニズムをシミュレートし、時間とともに異なる平衡間の明確な遷移を見いだす。
我々は,関連文献に触発された分析ツールを定義して社会成果を計測し,これらを用いて異なる環境介入の有効性に関する結論を導出する。
本手法は,人間および人工エージェントシステムにおける機構設計に影響を及ぼす。
関連論文リスト
- Evolving Neural Networks Reveal Emergent Collective Behavior from Minimal Agent Interactions [0.0]
ニューラルネットワークが動的環境におけるエージェントの行動を制御するためにどのように進化するかを検討する。
レーン形成や層流のような単純な挙動は、より線形なネットワーク操作によって特徴づけられる。
中程度のノイズ、広い視野、低いエージェント密度といった特定の環境パラメータは、非線形ネットワークの進化を促進する。
論文 参考訳(メタデータ) (2024-10-25T17:43:00Z) - Navigating the swarm: Deep neural networks command emergent behaviours [2.7059353835118602]
エージェント間相互作用ルールを微調整することにより,グローバルなパターンを意図した集合行動の協調構造を生成することができることを示す。
私たちの戦略では、望ましい構造を指示する相互作用ルールを見つけるために、ダイナミックスの法則に従うディープニューラルネットワークを採用しています。
本研究は, ロボット群操作, アクティブ物質組織, 生体システムにおける不明瞭な相互作用規則の解明における新たな応用の道を開くものである。
論文 参考訳(メタデータ) (2024-07-16T02:46:11Z) - Behavior-Inspired Neural Networks for Relational Inference [3.7219180084857473]
最近の研究は、エージェント間の関係を、その身体行動の観察に基づいて分類することを学ぶ。
エージェントの観測可能な振る舞いと,その動作を決定する潜在カテゴリの抽象化レベルを導入する。
エージェントの身体的近さと嗜好を非線形意見力学モデルに統合し、相互排他的潜在カテゴリを特定し、エージェントの時間的進化を予測し、エージェントの身体的挙動を制御するメカニズムを提供する。
論文 参考訳(メタデータ) (2024-06-20T21:36:54Z) - Problem-Solving in Language Model Networks [44.99833362998488]
この研究は、マルチエージェント論争の概念をより一般的なネットワークトポロジに拡張する。
質問応答の正確さ、影響、コンセンサス、および集団に対する偏見の影響を測定する。
論文 参考訳(メタデータ) (2024-06-18T07:59:14Z) - Scaling Large-Language-Model-based Multi-Agent Collaboration [75.5241464256688]
大規模言語モデルによるエージェントのパイオニア化は、マルチエージェントコラボレーションの設計パターンを暗示している。
神経スケーリング法則に触発された本研究では,マルチエージェント協調におけるエージェントの増加に類似の原理が適用されるかを検討する。
論文 参考訳(メタデータ) (2024-06-11T11:02:04Z) - SocialGFs: Learning Social Gradient Fields for Multi-Agent Reinforcement Learning [58.84311336011451]
マルチエージェント強化学習のための新しい勾配に基づく状態表現を提案する。
オフラインサンプルからソーシャルグラデーションフィールド(SocialGF)を学習するために,デノジングスコアマッチングを採用している。
実際に、SocialGFをMAPPOなど、広く使われているマルチエージェント強化学習アルゴリズムに統合する。
論文 参考訳(メタデータ) (2024-05-03T04:12:19Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。
チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文 参考訳(メタデータ) (2022-10-17T07:16:44Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - A game-theoretic analysis of networked system control for common-pool
resource management using multi-agent reinforcement learning [54.55119659523629]
マルチエージェント強化学習は近年,ネットワーク型システム制御へのアプローチとして大きな可能性を秘めている。
共通プールの資源は耕作可能な土地、淡水、湿地、野生生物、魚類資源、森林、大気である。
論文 参考訳(メタデータ) (2020-10-15T14:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。