論文の概要: Norm Enforcement with a Soft Touch: Faster Emergence, Happier Agents
- arxiv url: http://arxiv.org/abs/2401.16461v1
- Date: Mon, 29 Jan 2024 11:09:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 17:27:29.563748
- Title: Norm Enforcement with a Soft Touch: Faster Emergence, Happier Agents
- Title(参考訳): ソフトタッチによるノーム強化:より高速な創発, 幸せなエージェント
- Authors: Sz-Ting Tzeng, Nirav Ajmeri, Munindar P. Singh
- Abstract要約: マルチエージェントシステムは自律エージェントの社会と見なすことができ、その相互作用は社会的規範によって効果的に制御される。
我々は、エージェントが他のエージェントの満足感や満足感に欠ける行動に対して、これらの反応を、第1のエージェントから第2のエージェントへの通信として考える。
我々は、より広範なコミュニケーションと理解という形で、社会知性をモデル化するフレームワークであるNestを開発している。
- 参考スコア(独自算出の注目度): 15.315985512420568
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: A multiagent system can be viewed as a society of autonomous agents, whose
interactions can be effectively regulated via social norms. In general, the
norms of a society are not hardcoded but emerge from the agents' interactions.
Specifically, how the agents in a society react to each other's behavior and
respond to the reactions of others determines which norms emerge in the
society. We think of these reactions by an agent to the satisfactory or
unsatisfactory behaviors of another agent as communications from the first
agent to the second agent. Understanding these communications is a kind of
social intelligence: these communications provide natural drivers for norm
emergence by pushing agents toward certain behaviors, which can become
established as norms. Whereas it is well-known that sanctioning can lead to the
emergence of norms, we posit that a broader kind of social intelligence can
prove more effective in promoting cooperation in a multiagent system.
Accordingly, we develop Nest, a framework that models social intelligence in
the form of a wider variety of communications and understanding of them than in
previous work. To evaluate Nest, we develop a simulated pandemic environment
and conduct simulation experiments to compare Nest with baselines considering a
combination of three kinds of social communication: sanction, tell, and hint.
We find that societies formed of Nest agents achieve norms faster; moreover,
Nest agents effectively avoid undesirable consequences, which are negative
sanctions and deviation from goals, and yield higher satisfaction for
themselves than baseline agents despite requiring only an equivalent amount of
information.
- Abstract(参考訳): マルチエージェントシステムは自律エージェントの社会と見なすことができ、その相互作用は社会的規範によって効果的に制御される。
一般に、社会の規範はハードコードされていないが、エージェントの相互作用から生まれる。
特に、社会のエージェントがお互いの行動にどう反応し、他人の反応に反応するかは、社会においてどの規範が現れるかを決定する。
第1のエージェントから第2のエージェントへのコミュニケーションとして、他のエージェントの満足な行動や不満足な行動に対するエージェントによるこれらの反応を考えます。
これらのコミュニケーションを理解することは、一種の社会的知性である:これらのコミュニケーションは、エージェントを特定の行動に向かわせることによって、規範の発生を自然に促進する。
制裁が規範の出現につながることはよく知られているが、より広い種類の社会知能がマルチエージェントシステムにおける協力を促進する上でより効果的であることを示す。
そこで我々は,これまでの研究よりも幅広いコミュニケーションと理解という形で,ソーシャルインテリジェンスをモデル化するフレームワークであるnestを開発した。
そこで本研究では,nestをシミュレーションしたパンデミック環境を構築し,社会コミュニケーションの3種類の組み合わせを考慮に入れて,nestとベースラインを比較するシミュレーション実験を行った。
さらに,nestエージェントは,否定的な制裁や目標からの逸脱である望ましくない結果を効果的に回避し,同等の情報しか必要とせず,ベースラインエージェントよりも高い満足度を得る。
関連論文リスト
- SocialGFs: Learning Social Gradient Fields for Multi-Agent Reinforcement Learning [58.84311336011451]
マルチエージェント強化学習のための新しい勾配に基づく状態表現を提案する。
オフラインサンプルからソーシャルグラデーションフィールド(SocialGF)を学習するために,デノジングスコアマッチングを採用している。
実際に、SocialGFをMAPPOなど、広く使われているマルチエージェント強化学習アルゴリズムに統合する。
論文 参考訳(メタデータ) (2024-05-03T04:12:19Z) - Agent Alignment in Evolving Social Norms [65.45423591744434]
本稿では,エージェント進化とアライメントのための進化的フレームワークであるEvolutionaryAgentを提案する。
社会規範が継続的に進化する環境では、エージェントは現在の社会規範に適応し、生存と増殖の確率が高くなる。
進化的エージェントは、一般的なタスクにおいてその能力を維持しながら、進化する社会規範と徐々に整合できることを示す。
論文 参考訳(メタデータ) (2024-01-09T15:44:44Z) - Mediated Multi-Agent Reinforcement Learning [3.8581550679584473]
社会福祉を最大化するために、政策グラデーションを持つエージェントとともに仲介者を訓練する方法を示す。
行列ゲームと反復ゲームにおける実験は,マルチエージェント強化学習におけるメディエータの適用の可能性を強調した。
論文 参考訳(メタデータ) (2023-06-14T10:31:37Z) - Value Engineering for Autonomous Agents [3.6130723421895947]
従来のアプローチでは、値はエージェント推論の不可欠な構成要素ではなく、世界のいくつかの行動や状態に関連するラベルとして扱われていた。
道徳心理学と社会心理学を基盤とした新たなAMAパラダイムを提案する。
このタイプの規範的推論は、エージェントが規範の道徳的意味を理解することによって、自律的なエージェントに価値認識をもたらすと論じる。
論文 参考訳(メタデータ) (2023-02-17T08:52:15Z) - Aligning to Social Norms and Values in Interactive Narratives [89.82264844526333]
我々は、インタラクティブな物語やテキストベースのゲームにおいて、社会的に有益な規範や価値観に沿って行動するエージェントを作成することに注力する。
我々は、特別な訓練を受けた言語モデルに存在する社会的コモンセンス知識を用いて、社会的に有益な値に整合した行動にのみ、その行動空間を文脈的に制限するGAALADエージェントを紹介した。
論文 参考訳(メタデータ) (2022-05-04T09:54:33Z) - Normative Disagreement as a Challenge for Cooperative AI [56.34005280792013]
典型的な協調誘導学習アルゴリズムは、問題の解決に協力することができないと論じる。
我々は,ノルム適応政策のクラスを開発し,これらが協調性を著しく向上させることを示す実験を行った。
論文 参考訳(メタデータ) (2021-11-27T11:37:42Z) - Noe: Norms Emergence and Robustness Based on Emotions in Multiagent
Systems [0.0]
本稿では,モデリング感情が社会規範の出現と堅牢性に与える影響について,社会シミュレーション実験を通じて検討する。
標準満足度と違反の結果に対する感情的反応をエージェントが考慮できる能力は、規範遵守を促進する。
論文 参考訳(メタデータ) (2021-04-30T14:42:22Z) - Prosocial Norm Emergence in Multiagent Systems [14.431260905391138]
メンバーエージェントが適応的であるだけでなく、マルチエージェントシステム自体が適応的である設定を検討する。
我々は,社会の肯定的な成果を達成し,他人の福祉を考慮に入れて行動するためのエージェントへの指導をしばしば提供する,社会規範に焦点をあてる。
論文 参考訳(メタデータ) (2020-12-29T02:59:55Z) - Learning Latent Representations to Influence Multi-Agent Interaction [65.44092264843538]
エージェントのポリシーの潜在表現を学習するための強化学習に基づくフレームワークを提案する。
提案手法は代替手段よりも優れており,他のエージェントに影響を与えることを学習している。
論文 参考訳(メタデータ) (2020-11-12T19:04:26Z) - Learning to Incentivize Other Learning Agents [73.03133692589532]
我々は、学習インセンティブ関数を用いて、RLエージェントに他のエージェントに直接報酬を与える能力を持たせる方法を示す。
このようなエージェントは、一般的なマルコフゲームにおいて、標準のRLと対戦型エージェントを著しく上回っている。
私たちの仕事は、マルチエージェントの未来において共通の善を確実にする道のりに沿って、より多くの機会と課題を指しています。
論文 参考訳(メタデータ) (2020-06-10T20:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。