論文の概要: Emergent Resource Exchange and Tolerated Theft Behavior using
Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2307.01862v1
- Date: Tue, 4 Jul 2023 18:20:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-06 16:11:51.494260
- Title: Emergent Resource Exchange and Tolerated Theft Behavior using
Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習による創発的リソース交換と盗難防止行動
- Authors: Jack Garbus, Jordan Pollack
- Abstract要約: 本研究では, 捕食環境において資源を投棄し, 拾い上げることによって形成された, 新規かつ効果的な資源交換プロトコルの出現を実証する。
私たちは、エージェントが交換相手に騙されるのを避けることを学ぶが、必ずしも第三者からではないことに気付きました。
また,環境における処罰,戦闘,強姦のメカニズムが欠如しているにもかかわらず,許容盗難と類似した行動の出現も観察した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For decades, the evolution of cooperation has piqued the interest of numerous
academic disciplines such as game theory, economics, biology, and computer
science. In this work, we demonstrate the emergence of a novel and effective
resource exchange protocol formed by dropping and picking up resources in a
foraging environment. This form of cooperation is made possible by the
introduction of a campfire, which adds an extended period of congregation and
downtime for agents to explore otherwise unlikely interactions. We find that
the agents learn to avoid getting cheated by their exchange partners, but not
always from a third party. We also observe the emergence of behavior analogous
to tolerated theft, despite the lack of any punishment, combat, or larceny
mechanism in the environment.
- Abstract(参考訳): 何十年もの間、協調の進化はゲーム理論、経済学、生物学、コンピュータ科学といった多くの学術分野の関心を惹きつけてきた。
本研究では,捕食環境において資源を投棄し,拾い上げることによって形成される,新規で効果的な資源交換プロトコルの出現を実証する。
この形態の協力はキャンプファイヤーの導入によって可能となり、それ以外はあり得ない相互作用を探索するエージェントの会衆とダウンタイムが延長される。
エージェントは交換相手に騙されるのを避けることを学ぶが、必ずしも第三者からではない。
また,環境における処罰,戦闘,強姦のメカニズムが欠如しているにもかかわらず,許容盗難と類似した行動の出現も観察した。
関連論文リスト
- Deconstructing Cooperation and Ostracism via Multi-Agent Reinforcement
Learning [3.3751859064985483]
一方のエージェントが常に協力している場合でも,ネットワークのリワイアリングが相互協力を促進することを示す。
また、オストラシズムだけでは協力を浮かび上がらせるには不十分であることも分かっています。
本研究は,協力の出現に必要な条件とメカニズムについて考察した。
論文 参考訳(メタデータ) (2023-10-06T23:18:55Z) - Stubborn: An Environment for Evaluating Stubbornness between Agents with
Aligned Incentives [4.022057598291766]
フルアラインインセンティブを持つエージェント間の頑健性を評価する環境であるStubbornについて紹介する。
予備的な結果として, エージェントは, パートナーの頑健さを, 環境における選択の改善のシグナルとして活用することを学ぶ。
論文 参考訳(メタデータ) (2023-04-24T17:19:15Z) - Intrinsic fluctuations of reinforcement learning promote cooperation [0.0]
社会的ジレンマの状況における協力は、動物、人間、機械にとって不可欠である。
マルチエージェント・ラーニング・セッティングの個々の要素が協調にどのように寄与するかを実証する。
論文 参考訳(メタデータ) (2022-09-01T09:14:47Z) - Coach-assisted Multi-Agent Reinforcement Learning Framework for
Unexpected Crashed Agents [120.91291581594773]
本稿では,予期せぬクラッシュを伴う協調型マルチエージェント強化学習システムの公式な定式化について述べる。
本稿では,教師支援型多エージェント強化学習フレームワークを提案する。
私たちの知る限りでは、この研究はマルチエージェントシステムにおける予期せぬクラッシュを初めて研究したものです。
論文 参考訳(メタデータ) (2022-03-16T08:22:45Z) - Hidden Agenda: a Social Deduction Game with Diverse Learned Equilibria [57.74495091445414]
社会的推論ゲームは、個人が他人に関する潜在的に信頼できない情報を合成する方法を学ぶための道を提供する。
本研究では,未知のチームアライメントのシナリオにおいて,学習エージェントを研究するための2D環境を提供する2チームソーシャル推論ゲームであるHidden Agendaを紹介する。
Hidden Agendaで訓練された強化学習エージェントは、自然言語でのコミュニケーションを必要とせずに、協力や投票など、さまざまな行動を学ぶことができることを示した。
論文 参考訳(メタデータ) (2022-01-05T20:54:10Z) - Explore and Control with Adversarial Surprise [78.41972292110967]
強化学習(Reinforcement Learning, RL)は、目標指向のポリシーを学習するためのフレームワークである。
本稿では,RLエージェントが経験した驚きの量と競合する2つのポリシーを相殺する対戦ゲームに基づく,新しい教師なしRL手法を提案する。
本手法は, 明確な相転移を示すことによって, 複雑なスキルの出現につながることを示す。
論文 参考訳(メタデータ) (2021-07-12T17:58:40Z) - Birds of a Feather Flock Together: A Close Look at Cooperation Emergence
via Multi-Agent RL [20.22747008079794]
インセンティブ機構に起因する二階社会ジレンマのダイナミクスについて検討する。
ホモフィリーと呼ばれる人間の典型的な傾向は、この問題を解くことができる。
インセンティブ相同性を促進するための新しい学習枠組みを提案する。
論文 参考訳(メタデータ) (2021-04-23T08:00:45Z) - Learning Latent Representations to Influence Multi-Agent Interaction [65.44092264843538]
エージェントのポリシーの潜在表現を学習するための強化学習に基づくフレームワークを提案する。
提案手法は代替手段よりも優れており,他のエージェントに影響を与えることを学習している。
論文 参考訳(メタデータ) (2020-11-12T19:04:26Z) - Emergent Reciprocity and Team Formation from Randomized Uncertain Social
Preferences [8.10414043447031]
我々は,不確実な社会的嗜好(RUSP)をランダム化した訓練エージェントの創発的相互性,間接的相互性,評価,チーム形成の証拠を示す。
RUSPは汎用的でスケーラブルであり、元のゲームダイナミクスや目的を変更することなく、任意のマルチエージェント環境に適用することができる。
特に、RUSPではこれらの行動が出現し、より複雑な時間的環境において、Iterated Prisoner's Dilemmaのような古典的な抽象的社会ジレンマの社会福祉均衡をもたらすことが示される。
論文 参考訳(メタデータ) (2020-11-10T20:06:19Z) - Emergent Social Learning via Multi-agent Reinforcement Learning [91.57176641192771]
社会学習は、人間と動物の知性の重要な構成要素である。
本稿では,独立系強化学習エージェントが,社会的学習を用いてパフォーマンスを向上させることを学べるかどうかを検討する。
論文 参考訳(メタデータ) (2020-10-01T17:54:14Z) - Learning to Incentivize Other Learning Agents [73.03133692589532]
我々は、学習インセンティブ関数を用いて、RLエージェントに他のエージェントに直接報酬を与える能力を持たせる方法を示す。
このようなエージェントは、一般的なマルコフゲームにおいて、標準のRLと対戦型エージェントを著しく上回っている。
私たちの仕事は、マルチエージェントの未来において共通の善を確実にする道のりに沿って、より多くの機会と課題を指しています。
論文 参考訳(メタデータ) (2020-06-10T20:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。