論文の概要: Investigating the Impact of Direct Punishment on the Emergence of
Cooperation in Multi-Agent Reinforcement Learning Systems
- arxiv url: http://arxiv.org/abs/2301.08278v1
- Date: Thu, 19 Jan 2023 19:33:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-23 14:13:57.771398
- Title: Investigating the Impact of Direct Punishment on the Emergence of
Cooperation in Multi-Agent Reinforcement Learning Systems
- Title(参考訳): マルチエージェント強化学習システムにおける直接罰が協調の創発に及ぼす影響の検討
- Authors: Nayana Dasgupta, Mirco Musolesi
- Abstract要約: 本稿では,多エージェント強化学習システムにおける直接罰に関連する行動と学習のダイナミクスを包括的に分析する。
我々は、これらの重要なメカニズムが協調の出現に与える影響を広範囲かつ体系的に評価する。
- 参考スコア(独自算出の注目度): 2.5426469613007012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of cooperation is of fundamental importance for human societies,
with examples ranging from navigating road junctions to negotiating climate
treaties. As the use of AI becomes more pervasive within society, the need for
socially intelligent agents that are able to navigate these complex dilemmas is
becoming increasingly evident. Direct punishment is an ubiquitous social
mechanism that has been shown to benefit the emergence of cooperation within
the natural world, however no prior work has investigated its impact on
populations of learning agents. Moreover, although the use of all forms of
punishment in the natural world is strongly coupled with partner selection and
reputation, no existing work has provided a holistic analysis of their
combination within multi-agent systems. In this paper, we present a
comprehensive analysis of the behaviors and learning dynamics associated with
direct punishment in multi-agent reinforcement learning systems and how this
compares to third-party punishment, when both forms of punishment are combined
with other social mechanisms such as partner selection and reputation. We
provide an extensive and systematic evaluation of the impact of these key
mechanisms on the emergence of cooperation. Finally, we discuss the
implications of the use of these mechanisms in the design of cooperative AI
systems.
- Abstract(参考訳): 協力の問題は、道路合流点の航行から気候変動交渉まで、人間の社会にとって基本的な重要性である。
社会の中でAIの利用が広まるにつれ、これらの複雑なジレンマをナビゲートできる社会的にインテリジェントなエージェントの必要性がますます顕在化しつつある。
直接的な処罰は、自然界における協力の出現に寄与することが示されているユビキタスな社会メカニズムであるが、学習エージェントの集団への影響については、先行研究が調査していない。
さらに、自然界におけるあらゆる形態の罰の使用は、パートナーの選択と評判と強く結びついているが、既存の研究は、マルチエージェントシステムにおけるそれらの組み合わせの全体的分析を提供していない。
本稿では,多エージェント強化学習システムにおける直接罰と関連する行動と学習ダイナミクスの包括的分析を行い,両者がパートナー選択や評判といった他の社会的メカニズムと組み合わされた場合の第三者罰との比較について述べる。
我々は、これらの重要なメカニズムが協調の出現に与える影響を広範囲かつ体系的に評価する。
最後に、協調型AIシステムの設計におけるこれらのメカニズムの使用の意味について論じる。
関連論文リスト
- Causal Responsibility Attribution for Human-AI Collaboration [62.474732677086855]
本稿では,人間のAIシステムにおける責任を体系的に評価するために,構造因果モデル(SCM)を用いた因果的枠組みを提案する。
2つのケーススタディは、多様な人間とAIのコラボレーションシナリオにおけるフレームワークの適応性を示している。
論文 参考訳(メタデータ) (2024-11-05T17:17:45Z) - Multi-agent cooperation through learning-aware policy gradients [53.63948041506278]
利己的な個人はしばしば協力に失敗し、マルチエージェント学習の根本的な課題を提起する。
本稿では,学習型強化学習のための,偏見のない高導出性ポリシー勾配アルゴリズムを提案する。
我々は, 受刑者のジレンマから, 自己関心のある学習エージェントの間でどのように, いつ, 協力関係が生じるかの新たな説明を得た。
論文 参考訳(メタデータ) (2024-10-24T10:48:42Z) - Learning to Balance Altruism and Self-interest Based on Empathy in Mixed-Motive Games [47.8980880888222]
マルチエージェントのシナリオは、しばしば混合モチベーションを伴い、潜在的な搾取に対する自己保護が可能な利他的エージェントを要求する。
共感に基づくアルトリズムと自己利益のバランスをとるためのLASE学習を提案する。
LASEはその報酬の一部を共同プレイヤにギフトとして割り当て、このアロケーションは社会的関係に基づいて動的に適応する。
論文 参考訳(メタデータ) (2024-10-10T12:30:56Z) - Mutual Theory of Mind in Human-AI Collaboration: An Empirical Study with LLM-driven AI Agents in a Real-time Shared Workspace Task [56.92961847155029]
心の理論(ToM)は、他人を理解する上で重要な能力として、人間の協調とコミュニケーションに大きな影響を及ぼす。
Mutual Theory of Mind (MToM) は、ToM能力を持つAIエージェントが人間と協力するときに発生する。
エージェントのToM能力はチームのパフォーマンスに大きな影響を与えず,エージェントの人間的理解を高めていることがわかった。
論文 参考訳(メタデータ) (2024-09-13T13:19:48Z) - Emergent Cooperation under Uncertain Incentive Alignment [7.906156032228933]
頻繁な出会いを特徴とするシナリオにおける強化学習エージェント間の協力関係について検討する。
本研究では,複合モチベーション環境における協調を促進するために文献で提案されている評価や本質的な報酬などのメカニズムの効果について検討する。
論文 参考訳(メタデータ) (2024-01-23T10:55:54Z) - SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4138224020773]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。
エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。
GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文 参考訳(メタデータ) (2023-10-18T02:27:01Z) - Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View [60.80731090755224]
本稿では,理論的洞察を用いた実用実験により,現代NLPシステム間の協調機構を解明する。
我々は, LLMエージェントからなる4つの独特な社会をつくり, それぞれのエージェントは, 特定の特性(容易性, 過信性)によって特徴づけられ, 異なる思考パターン(議論, ふりかえり)と協調する。
以上の結果から, LLMエージェントは, 社会心理学理論を反映した, 適合性やコンセンサスリーディングといった人間的な社会的行動を示すことが明らかとなった。
論文 参考訳(メタデータ) (2023-10-03T15:05:52Z) - The art of compensation: how hybrid teams solve collective risk dilemmas [6.081979963786028]
適応剤と固定行動剤を併用したハイブリッド集団における協調の進化的ダイナミクスについて検討した。
後者の振る舞いを補うために,まず,行動に適応することを学ぶ方法を示す。
論文 参考訳(メタデータ) (2022-05-13T13:23:42Z) - Adversarial Attacks in Cooperative AI [0.0]
多エージェント環境における単エージェント強化学習アルゴリズムは協調の育成には不十分である。
敵機械学習における最近の研究は、モデルは容易に誤った決定を下すことができることを示している。
協調AIは、以前の機械学習研究では研究されなかった新たな弱点を導入する可能性がある。
論文 参考訳(メタデータ) (2021-11-29T07:34:12Z) - Birds of a Feather Flock Together: A Close Look at Cooperation Emergence
via Multi-Agent RL [20.22747008079794]
インセンティブ機構に起因する二階社会ジレンマのダイナミクスについて検討する。
ホモフィリーと呼ばれる人間の典型的な傾向は、この問題を解くことができる。
インセンティブ相同性を促進するための新しい学習枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-23T08:00:45Z) - Cooperation and Reputation Dynamics with Reinforcement Learning [6.219565750197311]
私達は信頼および協同を確立する方法として評判がいかに使用されるか示します。
好ましくない平衡への収束を緩和する2つのメカニズムを提案する。
この結果が進化ゲーム理論の文献とどのように関係しているかを示す。
論文 参考訳(メタデータ) (2021-02-15T12:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。