Fugu-MT 論文翻訳(概要): Emergent Resource Exchange and Tolerated Theft Behavior using Multi-Agent Reinforcement Learning

論文の概要: Emergent Resource Exchange and Tolerated Theft Behavior using Multi-Agent Reinforcement Learning

arxiv url: http://arxiv.org/abs/2307.01862v1
Date: Tue, 4 Jul 2023 18:20:31 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-06 16:11:51.494260
Title: Emergent Resource Exchange and Tolerated Theft Behavior using Multi-Agent Reinforcement Learning
Title（参考訳）: マルチエージェント強化学習による創発的リソース交換と盗難防止行動
Authors: Jack Garbus, Jordan Pollack
Abstract要約: 本研究では, 捕食環境において資源を投棄し, 拾い上げることによって形成された, 新規かつ効果的な資源交換プロトコルの出現を実証する。私たちは、エージェントが交換相手に騙されるのを避けることを学ぶが、必ずしも第三者からではないことに気付きました。また,環境における処罰,戦闘,強姦のメカニズムが欠如しているにもかかわらず,許容盗難と類似した行動の出現も観察した。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: For decades, the evolution of cooperation has piqued the interest of numerous academic disciplines such as game theory, economics, biology, and computer science. In this work, we demonstrate the emergence of a novel and effective resource exchange protocol formed by dropping and picking up resources in a foraging environment. This form of cooperation is made possible by the introduction of a campfire, which adds an extended period of congregation and downtime for agents to explore otherwise unlikely interactions. We find that the agents learn to avoid getting cheated by their exchange partners, but not always from a third party. We also observe the emergence of behavior analogous to tolerated theft, despite the lack of any punishment, combat, or larceny mechanism in the environment.
Abstract（参考訳）: 何十年もの間、協調の進化はゲーム理論、経済学、生物学、コンピュータ科学といった多くの学術分野の関心を惹きつけてきた。本研究では,捕食環境において資源を投棄し,拾い上げることによって形成される,新規で効果的な資源交換プロトコルの出現を実証する。この形態の協力はキャンプファイヤーの導入によって可能となり、それ以外はあり得ない相互作用を探索するエージェントの会衆とダウンタイムが延長される。エージェントは交換相手に騙されるのを避けることを学ぶが、必ずしも第三者からではない。また,環境における処罰,戦闘,強姦のメカニズムが欠如しているにもかかわらず,許容盗難と類似した行動の出現も観察した。

関連論文リスト

Multi-agent cooperation through learning-aware policy gradients [53.63948041506278]
利己的な個人はしばしば協力に失敗し、マルチエージェント学習の根本的な課題を提起する。本稿では,学習型強化学習のための,偏見のない高導出性ポリシー勾配アルゴリズムを提案する。我々は, 受刑者のジレンマから, 自己関心のある学習エージェントの間でどのように, いつ, 協力関係が生じるかの新たな説明を得た。
論文参考訳（メタデータ） (2024-10-24T10:48:42Z)
Reciprocal Reward Influence Encourages Cooperation From Self-Interested Agents [2.1301560294088318]
自己関心の個人間の協力は、自然界で広く見られる現象であるが、人工的な知的エージェント間の相互作用においては、いまだ解明されていない。そこで,本研究では,リターンに対する相手の行動の影響を再現するために,本質的に動機づけられた強化学習エージェントであるReciprocatorを紹介する。本研究では,同時学習において,時間的に拡張された社会的ジレンマにおける協調を促進するために,共用者が利用できることを示す。
論文参考訳（メタデータ） (2024-06-03T06:07:27Z)
Deconstructing Cooperation and Ostracism via Multi-Agent Reinforcement Learning [3.3751859064985483]
一方のエージェントが常に協力している場合でも,ネットワークのリワイアリングが相互協力を促進することを示す。また、オストラシズムだけでは協力を浮かび上がらせるには不十分であることも分かっています。本研究は,協力の出現に必要な条件とメカニズムについて考察した。
論文参考訳（メタデータ） (2023-10-06T23:18:55Z)
Stubborn: An Environment for Evaluating Stubbornness between Agents with Aligned Incentives [4.022057598291766]
フルアラインインセンティブを持つエージェント間の頑健性を評価する環境であるStubbornについて紹介する。予備的な結果として, エージェントは, パートナーの頑健さを, 環境における選択の改善のシグナルとして活用することを学ぶ。
論文参考訳（メタデータ） (2023-04-24T17:19:15Z)
Intrinsic fluctuations of reinforcement learning promote cooperation [0.0]
社会的ジレンマの状況における協力は、動物、人間、機械にとって不可欠である。マルチエージェント・ラーニング・セッティングの個々の要素が協調にどのように寄与するかを実証する。
論文参考訳（メタデータ） (2022-09-01T09:14:47Z)
Hidden Agenda: a Social Deduction Game with Diverse Learned Equilibria [57.74495091445414]
社会的推論ゲームは、個人が他人に関する潜在的に信頼できない情報を合成する方法を学ぶための道を提供する。本研究では,未知のチームアライメントのシナリオにおいて,学習エージェントを研究するための2D環境を提供する2チームソーシャル推論ゲームであるHidden Agendaを紹介する。 Hidden Agendaで訓練された強化学習エージェントは、自然言語でのコミュニケーションを必要とせずに、協力や投票など、さまざまな行動を学ぶことができることを示した。
論文参考訳（メタデータ） (2022-01-05T20:54:10Z)
Explore and Control with Adversarial Surprise [78.41972292110967]
強化学習(Reinforcement Learning, RL)は、目標指向のポリシーを学習するためのフレームワークである。本稿では,RLエージェントが経験した驚きの量と競合する2つのポリシーを相殺する対戦ゲームに基づく,新しい教師なしRL手法を提案する。本手法は, 明確な相転移を示すことによって, 複雑なスキルの出現につながることを示す。
論文参考訳（メタデータ） (2021-07-12T17:58:40Z)
Birds of a Feather Flock Together: A Close Look at Cooperation Emergence via Multi-Agent RL [20.22747008079794]
インセンティブ機構に起因する二階社会ジレンマのダイナミクスについて検討する。ホモフィリーと呼ばれる人間の典型的な傾向は、この問題を解くことができる。インセンティブ相同性を促進するための新しい学習枠組みを提案する。
論文参考訳（メタデータ） (2021-04-23T08:00:45Z)
Learning Latent Representations to Influence Multi-Agent Interaction [65.44092264843538]
エージェントのポリシーの潜在表現を学習するための強化学習に基づくフレームワークを提案する。提案手法は代替手段よりも優れており,他のエージェントに影響を与えることを学習している。
論文参考訳（メタデータ） (2020-11-12T19:04:26Z)
Emergent Social Learning via Multi-agent Reinforcement Learning [91.57176641192771]
社会学習は、人間と動物の知性の重要な構成要素である。本稿では,独立系強化学習エージェントが,社会的学習を用いてパフォーマンスを向上させることを学べるかどうかを検討する。
論文参考訳（メタデータ） (2020-10-01T17:54:14Z)
Learning to Incentivize Other Learning Agents [73.03133692589532]
我々は、学習インセンティブ関数を用いて、RLエージェントに他のエージェントに直接報酬を与える能力を持たせる方法を示す。このようなエージェントは、一般的なマルコフゲームにおいて、標準のRLと対戦型エージェントを著しく上回っている。私たちの仕事は、マルチエージェントの未来において共通の善を確実にする道のりに沿って、より多くの機会と課題を指しています。
論文参考訳（メタデータ） (2020-06-10T20:12:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。