論文の概要: Learning Collective Action under Risk Diversity
- arxiv url: http://arxiv.org/abs/2201.12891v1
- Date: Sun, 30 Jan 2022 18:21:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 18:24:23.963166
- Title: Learning Collective Action under Risk Diversity
- Title(参考訳): リスク多様性の下で集団行動を学ぶ
- Authors: Ramona Merhej, Fernando P. Santos, Francisco S. Melo, Mohamed
Chetouani, Francisco C. Santos
- Abstract要約: 集団的リスクジレンマを演じることを学ぶエージェントのグループにおけるリスク多様性の結果について検討する。
リスクの多様性は、全体的な協力を著しく減らし、全体的な目標達成を妨げることを示す。
この結果から,エージェント間のリスク認識の整合性や新たな学習技術開発の必要性が浮き彫りになった。
- 参考スコア(独自算出の注目度): 68.88688248278102
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collective risk dilemmas (CRDs) are a class of n-player games that represent
societal challenges where groups need to coordinate to avoid the risk of a
disastrous outcome. Multi-agent systems incurring such dilemmas face
difficulties achieving cooperation and often converge to sub-optimal,
risk-dominant solutions where everyone defects. In this paper we investigate
the consequences of risk diversity in groups of agents learning to play CRDs.
We find that risk diversity places new challenges to cooperation that are not
observed in homogeneous groups. We show that increasing risk diversity
significantly reduces overall cooperation and hinders collective target
achievement. It leads to asymmetrical changes in agents' policies -- i.e. the
increase in contributions from individuals at high risk is unable to compensate
for the decrease in contributions from individuals at low risk -- which overall
reduces the total contributions in a population. When comparing RL behaviors to
rational individualistic and social behaviors, we find that RL populations
converge to fairer contributions among agents. Our results highlight the need
for aligning risk perceptions among agents or develop new learning techniques
that explicitly account for risk diversity.
- Abstract(参考訳): 集団リスクジレンマ(英: Collective risk dilemmas, CRDs)は、集団が破壊的な結果のリスクを避けるために協調する必要がある社会的な課題を表すゲームである。
このようなジレンマを発生させるマルチエージェントシステムは、協力を達成するのに困難に直面し、しばしば全ての欠陥がある準最適、リスク支配的なソリューションに収束する。
本稿では,CRDをプレイすることを学ぶエージェント集団におけるリスク多様性の影響について検討する。
リスク多様性は、同種グループでは観察されない新しい課題を協調に与えている。
リスク多様性の増大は、全体的な協力を著しく減らし、全体的な目標達成を妨げることを示す。
エージェントの政策の非対称的な変化、すなわちリスクの高い個人からの貢献の増加は、リスクの低い個人からの貢献の減少を補うことができない。
RLの行動と合理的な個人主義的行動と社会的行動を比較すると、RLの集団はエージェント間の公平な貢献に収束する。
本研究は,リスク認知をエージェント間で整合させたり,リスクの多様性を明示する新たな学習手法を開発する必要性を強調した。
関連論文リスト
- Risk-Sensitive Multi-Agent Reinforcement Learning in Network Aggregative
Markov Games [2.85386288555414]
ネットワーク集約ゲーム(NAMG)のCPTリスクを考慮した分散サンプリングベースアクタクリティカル(AC)アルゴリズムを提案する。
一組の仮定の下で、NAMGにおける完全ナッシュ均衡の主観的な概念を証明する。
実験により、主観的な政策はリスク中立的な政策とは異なる可能性があることが示された。
論文 参考訳(メタデータ) (2024-02-08T18:43:27Z) - RiskQ: Risk-sensitive Multi-Agent Reinforcement Learning Value Factorization [49.26510528455664]
本稿では,リスクに敏感な個人・グローバル・マックス(RIGM)の原則を,個人・グローバル・マックス(IGM)と分散IGM(DIGM)の原則の一般化として紹介する。
RiskQは広範な実験によって有望な性能が得られることを示す。
論文 参考訳(メタデータ) (2023-11-03T07:18:36Z) - Provably Efficient Iterated CVaR Reinforcement Learning with Function
Approximation and Human Feedback [57.6775169085215]
リスクに敏感な強化学習は、期待される報酬とリスクのバランスをとるポリシーを最適化することを目的としている。
本稿では,線形および一般関数近似の下で,CVaR(Iterated Conditional Value-at-Risk)を目標とする新しいフレームワークを提案する。
本稿では,この反復CVaR RLに対するサンプル効率の高いアルゴリズムを提案し,厳密な理論的解析を行う。
論文 参考訳(メタデータ) (2023-07-06T08:14:54Z) - Anticipatory Thinking Challenges in Open Worlds: Risk Management [7.820667552233988]
AIシステムが日々の生活の一部になるにつれ、彼らもリスクを管理し始めています。
低周波で高インパクトなリスクを識別し緩和する学習は、機械学習モデルをトレーニングするために必要な観察バイアスと相反する。
私たちのゴールは、オープンワールドと究極的には現実世界のリスクを管理するためにAIエージェントが必要とする予測思考を評価し改善するソリューションの研究を促進することです。
論文 参考訳(メタデータ) (2023-06-22T18:31:17Z) - Social Diversity Reduces the Complexity and Cost of Fostering Fairness [63.70639083665108]
不完全な情報や公平性の柔軟な基準を前提とした干渉機構の効果について検討する。
多様性の役割を定量化し、情報収集の必要性を減らす方法を示す。
この結果から,多様性が変化し,公正性向上を目指す機関に新たなメカニズムが開放されることが示唆された。
論文 参考訳(メタデータ) (2022-11-18T21:58:35Z) - Learning Risk-Averse Equilibria in Multi-Agent Systems [13.25454171233235]
マルチエージェントシステムでは、知的エージェントは、他のエージェントのアクションが期待通りである場合に最適な結果をもたらす決定を行う。
本稿では,学習者が予期せぬ行動に適応できる新たなリスク回避ソリューションを提案する。
リスク-逆均衡を近似するエージェントの集団は、特に目に見えない反対の集団の存在に有効であることを示す。
論文 参考訳(メタデータ) (2022-05-30T21:20:30Z) - A Survey of Risk-Aware Multi-Armed Bandits [84.67376599822569]
我々は、様々な利害リスク対策をレビューし、その特性についてコメントする。
我々は,探索と探索のトレードオフが現れる,後悔の最小化設定のためのアルゴリズムを検討する。
今後の研究の課題と肥大化についてコメントし、締めくくりに締めくくります。
論文 参考訳(メタデータ) (2022-05-12T02:20:34Z) - Efficient Risk-Averse Reinforcement Learning [79.61412643761034]
リスク逆強化学習(RL)では、リターンのリスク測定を最適化することが目標である。
特定の条件下では、これは必然的に局所最適障壁につながることを証明し、それを回避するためのソフトリスク機構を提案する。
迷路ナビゲーション,自律運転,資源配分ベンチマークにおいて,リスク回避の改善を示す。
論文 参考訳(メタデータ) (2022-05-10T19:40:52Z) - Improved cooperation by balancing exploration and exploitation in
intertemporal social dilemma tasks [2.541277269153809]
本研究では,探索と搾取のバランスをとることができる学習率を組み込むことで協調を達成するための新たな学習戦略を提案する。
簡単な戦略を駆使したエージェントは、時間的社会的ジレンマと呼ばれる意思決定タスクにおいて、相対的に集団的リターンを改善する。
また、学習率の多様性が強化学習エージェントの人口に与える影響についても検討し、異種集団で訓練されたエージェントが特に協調した政策を発達させることを示す。
論文 参考訳(メタデータ) (2021-10-19T08:40:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。