論文の概要: Social diversity and social preferences in mixed-motive reinforcement
learning
- arxiv url: http://arxiv.org/abs/2002.02325v2
- Date: Wed, 12 Feb 2020 19:35:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 12:54:51.885706
- Title: Social diversity and social preferences in mixed-motive reinforcement
learning
- Title(参考訳): 混合動機強化学習における社会的多様性と社会的嗜好
- Authors: Kevin R. McKee, Ian Gemp, Brian McWilliams, Edgar A.
Du\'e\~nez-Guzm\'an, Edward Hughes, and Joel Z. Leibo
- Abstract要約: 混合動機ゲームにおける強化学習の研究は、主に同質なアプローチを活用している。
混合動機強化学習における集団の不均一性の影響について検討した。
- 参考スコア(独自算出の注目度): 11.010593309447067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent research on reinforcement learning in pure-conflict and pure-common
interest games has emphasized the importance of population heterogeneity. In
contrast, studies of reinforcement learning in mixed-motive games have
primarily leveraged homogeneous approaches. Given the defining characteristic
of mixed-motive games--the imperfect correlation of incentives between group
members--we study the effect of population heterogeneity on mixed-motive
reinforcement learning. We draw on interdependence theory from social
psychology and imbue reinforcement learning agents with Social Value
Orientation (SVO), a flexible formalization of preferences over group outcome
distributions. We subsequently explore the effects of diversity in SVO on
populations of reinforcement learning agents in two mixed-motive Markov games.
We demonstrate that heterogeneity in SVO generates meaningful and complex
behavioral variation among agents similar to that suggested by interdependence
theory. Empirical results in these mixed-motive dilemmas suggest agents trained
in heterogeneous populations develop particularly generalized, high-performing
policies relative to those trained in homogeneous populations.
- Abstract(参考訳): 純粋および純粋共通関心ゲームにおける強化学習に関する最近の研究は、人口の多様性の重要性を強調している。
対照的に、混合モチベーションゲームにおける強化学習の研究は、主に均質なアプローチを利用している。
混合モチベーションゲームの定義的特徴--グループメンバー間のインセンティブの不完全相関-を踏まえ,混合モチベーション強化学習における集団の多様性の影響について検討した。
我々は,社会心理学と社会的価値指向(Social Value Orientation, SVO)を用いたImbue強化学習エージェントから相互依存理論を導出し, グループ成果分布に対する嗜好の柔軟な定式化を行う。
次に,2つの混合モチベーションマルコフゲームにおける強化学習エージェントの集団に対するsvoの多様性の影響について検討した。
SVOにおける不均一性は、相互依存理論によって示唆されるエージェントの有意義で複雑な挙動変化を生じさせることを示した。
これらの混合モチベーションジレンマの実証的な結果は、不均質な集団で訓練されたエージェントが、均質な集団で訓練されたエージェントと比較して、特に一般化し、高いパフォーマンスのポリシーを発達させることを示唆している。
関連論文リスト
- The Factuality Tax of Diversity-Intervened Text-to-Image Generation: Benchmark and Fact-Augmented Intervention [61.80236015147771]
我々は多様性の介入とT2Iモデルにおける人口統計学的事実性とのトレードオフを定量化する。
DoFaiRの実験では、多様性指向の指示によって、性別や人種の異なる集団の数が増加することが明らかになった。
本研究では,歴史における世代ごとのジェンダーや人種構成について,言語化された事実情報を反映したFact-Augmented Intervention (FAI)を提案する。
論文 参考訳(メタデータ) (2024-06-29T09:09:42Z) - Dynamics of Moral Behavior in Heterogeneous Populations of Learning Agents [3.7414804164475983]
本研究では、道徳的に異質な集団が社会的ジレンマ環境で相互作用する学習力学について研究する。
我々は、親社会と反社会的エージェント間のいくつかの非自明な相互作用を観察する。
ある種の道徳的エージェントは、より協調的な行動に向けて利己的なエージェントを操ることができる。
論文 参考訳(メタデータ) (2024-03-07T04:12:24Z) - Generalizable Heterogeneous Federated Cross-Correlation and Instance
Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。
不均一な問題に対しては、無関係な公開データを通信に活用する。
局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文 参考訳(メタデータ) (2023-09-28T09:32:27Z) - Heterogeneous Social Value Orientation Leads to Meaningful Diversity in
Sequential Social Dilemmas [15.171556039829161]
社会的価値指向(Social Value Orientation、SVO)は、個人が自分と他人の間に資源を割り当てる確率を記述する。
以前の研究では、不均一なSVOが与えられたエージェントのグループは、囚人のジレンマのインセンティブ構造に似た設定で多様なポリシーを学ぶことが示されている。
これらの最良応答エージェントは、共プレイヤに条件付きポリシーを学習していることが、ゼロショット一般化結果の改善の理由であることを示す。
論文 参考訳(メタデータ) (2023-05-01T11:09:23Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z) - Learning Roles with Emergent Social Value Orientations [49.16026283952117]
本稿では、人間社会における典型的な「労働・役割の分断」のメカニズムを紹介する。
我々は、社会的価値指向(SVO)を伴う時空間的社会的ジレンマ(ISD)に対する有望な解決策を提供する。
創発的SVOによる学習ロール(RESVO)と呼ばれる新しい学習フレームワークは、役割の学習を社会的価値指向の出現に変換するために提案されている。
論文 参考訳(メタデータ) (2023-01-31T17:54:09Z) - Picking on the Same Person: Does Algorithmic Monoculture lead to Outcome
Homogenization? [90.35044668396591]
機械学習における繰り返しのテーマはアルゴリズムによるモノカルチャーである。同じシステム、またはコンポーネントを共有するシステムは、複数の意思決定者によってデプロイされる。
意思決定者がトレーニングデータや特定のモデルなどのコンポーネントを共有すれば、より均一な結果が得られます。
我々はこの仮説をアルゴリズムフェアネスベンチマークで検証し、トレーニングデータの共有がホモジェナイゼーションを確実に悪化させることを示した。
結果の均質化に関する哲学的分析と社会的な課題を、デプロイされた機械学習システムに含めることに着目して結論付ける。
論文 参考訳(メタデータ) (2022-11-25T09:33:11Z) - Sociodemographic inequalities in student achievement: An intersectional
multilevel analysis of individual heterogeneity and discriminatory accuracy
(MAIHDA) with application to students in London, England [0.0]
本研究は,イギリス・ロンドンに在住する2人の学生を対象に,学生の達成度における社会デマロジカルな不平等について検討した。
対話的な効果ではなく,主に添加物によって構成される達成度において,実質的な成層レベルの変動がみられた。
政策立案者は、余剰学生の増員にもっと注意を払うべきだと結論付けている。
論文 参考訳(メタデータ) (2022-11-10T16:16:52Z) - Learning Collective Action under Risk Diversity [68.88688248278102]
集団的リスクジレンマを演じることを学ぶエージェントのグループにおけるリスク多様性の結果について検討する。
リスクの多様性は、全体的な協力を著しく減らし、全体的な目標達成を妨げることを示す。
この結果から,エージェント間のリスク認識の整合性や新たな学習技術開発の必要性が浮き彫りになった。
論文 参考訳(メタデータ) (2022-01-30T18:21:21Z) - Improved cooperation by balancing exploration and exploitation in
intertemporal social dilemma tasks [2.541277269153809]
本研究では,探索と搾取のバランスをとることができる学習率を組み込むことで協調を達成するための新たな学習戦略を提案する。
簡単な戦略を駆使したエージェントは、時間的社会的ジレンマと呼ばれる意思決定タスクにおいて、相対的に集団的リターンを改善する。
また、学習率の多様性が強化学習エージェントの人口に与える影響についても検討し、異種集団で訓練されたエージェントが特に協調した政策を発達させることを示す。
論文 参考訳(メタデータ) (2021-10-19T08:40:56Z) - The Evolutionary Dynamics of Independent Learning Agents in Population
Games [21.68881173635777]
本稿では,集団ゲームにおける独立学習エージェントのプロセスとダイナミクスの形式的関係について述べる。
マスター方程式アプローチを用いて、人口動態を特徴付けるための新しい統一的な枠組みを提供する。
論文 参考訳(メタデータ) (2020-06-29T14:22:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。