Fugu-MT 論文翻訳(概要): Deep reinforcement learning models the emergent dynamics of human cooperation

論文の概要: Deep reinforcement learning models the emergent dynamics of human cooperation

arxiv url: http://arxiv.org/abs/2103.04982v1
Date: Mon, 8 Mar 2021 18:58:40 GMT
ステータス: 翻訳完了
システム内更新日: 2021-03-09 15:16:13.151683
Title: Deep reinforcement learning models the emergent dynamics of human cooperation
Title（参考訳）: 深層強化学習モデルによる人的協力の創発的ダイナミクス
Authors: Kevin R. McKee, Edward Hughes, Tina O. Zhu, Martin J. Chadwick, Raphael Koster, Antonio Garcia Castaneda, Charlie Beattie, Thore Graepel, Matt Botvinick, Joel Z. Leibo
Abstract要約: 実験では、社会的認知メカニズムが集団行動の場所と時期にどのように貢献するかを明かすことができなかった。我々は,多エージェントの深層強化学習を活用し,社会認知メカニズム,特に,評価の高い集団行動を達成するための本質的な動機をモデル化する。
参考スコア（独自算出の注目度）: 13.425401489679583
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Collective action demands that individuals efficiently coordinate how much, where, and when to cooperate. Laboratory experiments have extensively explored the first part of this process, demonstrating that a variety of social-cognitive mechanisms influence how much individuals choose to invest in group efforts. However, experimental research has been unable to shed light on how social cognitive mechanisms contribute to the where and when of collective action. We leverage multi-agent deep reinforcement learning to model how a social-cognitive mechanism--specifically, the intrinsic motivation to achieve a good reputation--steers group behavior toward specific spatial and temporal strategies for collective action in a social dilemma. We also collect behavioral data from groups of human participants challenged with the same dilemma. The model accurately predicts spatial and temporal patterns of group behavior: in this public goods dilemma, the intrinsic motivation for reputation catalyzes the development of a non-territorial, turn-taking strategy to coordinate collective action.
Abstract（参考訳）: 集団行動は、個人が協力する金額、場所、時期を効率的に調整することを要求する。実験室の実験は、このプロセスの最初の部分を調査し、様々な社会的認知メカニズムが、個人が集団活動にどれだけ投資するかに影響することを実証した。しかし、実験的な研究は集団行動の場所と時間に社会認知メカニズムがどのように寄与するかを明らかにできなかった。本研究では,多エージェント深層強化学習を用いて,社会的ジレンマにおける集団行動の特定の空間的・時間的戦略に向けて,社会的認知的メカニズムのモデル化を行う。また、同じジレンマで挑戦された人間の集団の行動データを収集する。モデルは、集団行動の空間的および時間的パターンを正確に予測する:この公共財ジレンマでは、評判の本質的な動機は、集団行動をコーディネートするための非領土のターンテイク戦略の開発を触媒する。

関連論文リスト

Emergence of human-like polarization among large language model agents [61.622596148368906]
我々は、何千もの大規模言語モデルエージェントを含むネットワーク化されたシステムをシミュレートし、それらの社会的相互作用を発見し、人間のような偏極をもたらす。人間とLLMエージェントの類似性は、社会的分極を増幅する能力に関する懸念を提起するだけでなく、それを緩和するための有効な戦略を特定するための貴重なテストベッドとして機能する可能性も持っている。
論文参考訳（メタデータ） (2025-01-09T11:45:05Z)
Multi-agent cooperation through learning-aware policy gradients [53.63948041506278]
利己的な個人はしばしば協力に失敗し、マルチエージェント学習の根本的な課題を提起する。本稿では,学習型強化学習のための,偏見のない高導出性ポリシー勾配アルゴリズムを提案する。我々は, 受刑者のジレンマから, 自己関心のある学習エージェントの間でどのように, いつ, 協力関係が生じるかの新たな説明を得た。
論文参考訳（メタデータ） (2024-10-24T10:48:42Z)
PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文参考訳（メタデータ） (2024-07-17T08:13:22Z)
Enhancing Cooperation through Selective Interaction and Long-term Experiences in Multi-Agent Reinforcement Learning [10.932974027102619]
本研究では,空間的囚人のジレンマゲームにおけるマルチエージェント強化学習に基づく計算フレームワークを提案する。 2つの異なるQ-ネットを用いて各エージェントをモデル化することにより、協調と相互作用の共進化ダイナミクスを解き放つ。
論文参考訳（メタデータ） (2024-05-04T12:42:55Z)
Social Motion Prediction with Cognitive Hierarchies [19.71780279070757]
我々は新しいベンチマーク、新しい定式化、認知に触発されたフレームワークを紹介する。 We present Wusi, a 3D multi-person motion data under the context of team sports。戦略的社会的相互作用を予測するための認知階層構造を構築した。
論文参考訳（メタデータ） (2023-11-08T14:51:17Z)
Discovering Individual Rewards in Collective Behavior through Inverse Multi-Agent Reinforcement Learning [3.4437947384641032]
政外逆マルチエージェント強化学習アルゴリズム(IMARL)を導入する。実演を活用することで,アルゴリズムは報酬関数を自動的に発見し,エージェントの効果的なポリシーを学習する。提案するIMARLアルゴリズムは, 構成成分の観点から, 集合力学を理解するための重要なステップである。
論文参考訳（メタデータ） (2023-05-17T20:07:30Z)
Predicting the long-term collective behaviour of fish pairs with deep learning [52.83927369492564]
本研究では,魚種Hemigrammus rhodostomusの社会的相互作用を評価するための深層学習モデルを提案する。我々は、ディープラーニングのアプローチの結果と実験結果と、最先端の分析モデルの結果を比較した。機械学習モデルにより、ソーシャルインタラクションは、微妙な実験的観測可能な解析的相互作用と直接競合できることを実証する。
論文参考訳（メタデータ） (2023-02-14T05:25:03Z)
Flexible social inference facilitates targeted social learning when rewards are not observable [58.762004496858836]
グループは、個人が他人の成功から学べるときにより効果的にコーディネートする。社会的推論能力は、このギャップを埋める助けとなり、個人が他人の基本的な知識に対する信念を更新し、観察可能な行動軌跡から成功することを示唆する。
論文参考訳（メタデータ） (2022-12-01T21:04:03Z)
Development of collective behavior in newborn artificial agents [0.0]
我々は、深層強化学習と好奇心駆動学習を用いて、集団行動を発達させる新しい人工エージェントを構築する。我々のエージェントは、本質的なモチベーション(好奇心)のみを用いて、外部の報酬なしに集団行動を学ぶ。この研究は、高次元の感覚入力と集団行動の分離を橋渡しし、その結果、集合動物の行動のピクセル間相互作用モデルをもたらす。
論文参考訳（メタデータ） (2021-11-06T03:46:31Z)
Improved cooperation by balancing exploration and exploitation in intertemporal social dilemma tasks [2.541277269153809]
本研究では,探索と搾取のバランスをとることができる学習率を組み込むことで協調を達成するための新たな学習戦略を提案する。簡単な戦略を駆使したエージェントは、時間的社会的ジレンマと呼ばれる意思決定タスクにおいて、相対的に集団的リターンを改善する。また、学習率の多様性が強化学習エージェントの人口に与える影響についても検討し、異種集団で訓練されたエージェントが特に協調した政策を発達させることを示す。
論文参考訳（メタデータ） (2021-10-19T08:40:56Z)
Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文参考訳（メタデータ） (2021-07-10T03:49:41Z)
Intrinsic Motivation for Encouraging Synergistic Behavior [55.10275467562764]
スパース・リワード・シナジスティック・タスクにおける強化学習の探索バイアスとしての本質的モチベーションの役割について検討した。私たちのキーとなる考え方は、シナジスティックなタスクにおける本質的なモチベーションのための優れた指針は、エージェントが自分自身で行動している場合、達成できない方法で世界に影響を与える行動を取ることである。
論文参考訳（メタデータ） (2020-02-12T19:34:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。