論文の概要: How social reinforcement learning can lead to metastable polarisation and the voter model
- arxiv url: http://arxiv.org/abs/2406.07993v2
- Date: Tue, 15 Oct 2024 17:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-16 13:57:38.127580
- Title: How social reinforcement learning can lead to metastable polarisation and the voter model
- Title(参考訳): 社会的強化学習が準安定分極と有権者モデルにどう寄与するか
- Authors: Benedikt V. Meylahn, Janusz M. Meylahn,
- Abstract要約: 最近のシミュレーション研究は、エージェントが社会的強化学習を用いて意見を形成するとき、偏極は持続的であることを示している。
シミュレーション研究のモデルで観測された偏光は無限に持続できず、確率1と一致していることを示す。
強化学習モデルと有権者モデルとのリンクを構築することにより、観測された分極は準安定であると主張する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Previous explanations for the persistence of polarization of opinions have typically included modelling assumptions that predispose the possibility of polarization (i.e., assumptions allowing a pair of agents to drift apart in their opinion such as repulsive interactions or bounded confidence). An exception is a recent simulation study showing that polarization is persistent when agents form their opinions using social reinforcement learning. Our goal is to highlight the usefulness of reinforcement learning in the context of modeling opinion dynamics, but that caution is required when selecting the tools used to study such a model. We show that the polarization observed in the model of the simulation study cannot persist indefinitely, and exhibits consensus asymptotically with probability one. By constructing a link between the reinforcement learning model and the voter model, we argue that the observed polarization is metastable. Finally, we show that a slight modification in the learning process of the agents changes the model from being non-ergodic to being ergodic. Our results show that reinforcement learning may be a powerful method for modelling polarization in opinion dynamics, but that the tools (objects to study such as the stationary distribution, or time to absorption for example) appropriate for analysing such models crucially depend on their properties (such as ergodicity, or transience). These properties are determined by the details of the learning process and may be difficult to identify based solely on simulations.
- Abstract(参考訳): 従来の意見の偏極の持続性に関する説明は、通常、偏極の可能性を前提としたモデル化の仮定(すなわち、反発的相互作用や有界信頼など、エージェントのペアが彼らの意見でバラバラにすることを許す仮定)を含んでいた。
例外は、エージェントが社会的強化学習を用いて意見を形成するとき、偏極が持続的であることを示す最近のシミュレーション研究である。
我々のゴールは、意見力学をモデル化する文脈における強化学習の有用性を強調することであるが、そのようなモデルの研究に使用されるツールを選択する際には、注意が必要である。
シミュレーション研究のモデルで観測された偏光は無限に持続できないことを示し、確率1と漸近的にコンセンサスを示す。
強化学習モデルと有権者モデルとのリンクを構築することにより、観測された分極は準安定であると主張する。
最後に,エージェントの学習過程のわずかな変更により,モデルが非エルゴディックからエルゴディックに変化することを示す。
以上の結果から,強化学習は意見力学における分極をモデル化する強力な手法である可能性が示唆された。しかし,そのようなモデル解析に適したツール(定常分布や吸収時間など)は,その特性(エルゴード性やトランジェンスなど)に大きく依存している。
これらの特性は学習過程の詳細によって決定され、シミュレーションのみに基づいて識別することは困難である。
関連論文リスト
- MAGIC: Modular Auto-encoder for Generalisable Model Inversion with Bias Corrections [0.19241821314180374]
我々は、標準オートエンコーダのデコーダステージを物理モデルに置き換え、バイアス補正層で置き換える。
この一般化可能なアプローチは、モデルを同時に反転させ、バイアスの性質について強い仮定をすることなく、そのバイアスをエンドツーエンドで補正する。
我々の手法は、バイアスを明示的にフィルタリングすることなく、古典的なアプローチの結果に一致または超えます。
論文 参考訳(メタデータ) (2024-05-29T10:11:10Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Guide the Learner: Controlling Product of Experts Debiasing Method Based
on Token Attribution Similarities [17.082695183953486]
一般的な回避策は、二次バイアスモデルに基づいてトレーニング例を再重み付けすることで、堅牢なモデルをトレーニングすることである。
ここでは、バイアスドモデルが機能をショートカットする、という前提がある。
本稿では,主要モデルと偏りのあるモデル属性スコアの類似性を,プロダクト・オブ・エキスパートズ・ロス関数に組み込んだ微調整戦略を提案する。
論文 参考訳(メタデータ) (2023-02-06T15:21:41Z) - The drivers of online polarization: fitting models to data [0.0]
エコーチャンバー効果と意見偏光は、情報消費における人間のバイアスや、フィードアルゴリズムによって生成されるパーソナライズされたレコメンデーションなど、いくつかの要因によって引き起こされる可能性がある。
これまでは主に意見力学モデルを用いて、分極とエコーチャンバーの出現の背後にあるメカニズムを探索してきた。
シミュレーションから得られた意見分布とソーシャルメディア上で測定した意見分布を数値的に比較する手法を提案する。
論文 参考訳(メタデータ) (2022-05-31T17:00:41Z) - Explain, Edit, and Understand: Rethinking User Study Design for
Evaluating Model Explanations [97.91630330328815]
我々はクラウドソーシング研究を行い、真偽のホテルレビューと偽のホテルレビューを区別するために訓練された詐欺検出モデルと対話する。
単語の線形バッグモデルでは、トレーニング中に特徴係数にアクセスした参加者は、非説明制御と比較して、テストフェーズにおいてモデルの信頼性が大幅に低下する可能性があることを観察する。
論文 参考訳(メタデータ) (2021-12-17T18:29:56Z) - Estimation of Bivariate Structural Causal Models by Variational Gaussian
Process Regression Under Likelihoods Parametrised by Normalising Flows [74.85071867225533]
因果機構は構造因果モデルによって記述できる。
最先端の人工知能の大きな欠点の1つは、説明責任の欠如である。
論文 参考訳(メタデータ) (2021-09-06T14:52:58Z) - Disentangling Observed Causal Effects from Latent Confounders using
Method of Moments [67.27068846108047]
我々は、軽度の仮定の下で、識別性と学習可能性に関する保証を提供する。
我々は,線形制約付き結合テンソル分解に基づく効率的なアルゴリズムを開発し,スケーラブルで保証可能な解を得る。
論文 参考訳(メタデータ) (2021-01-17T07:48:45Z) - Why do classifier accuracies show linear trends under distribution
shift? [58.40438263312526]
あるデータ分布上のモデルの精度は、別の分布上の精度のほぼ線形関数である。
2つのモデルが予測で一致する確率は、精度レベルだけで推測できるものよりも高いと仮定します。
分布シフトの大きさが大きければ, 2 つの分布のモデルを評価する場合, 線形傾向が生じなければならない。
論文 参考訳(メタデータ) (2020-12-31T07:24:30Z) - Learning from others' mistakes: Avoiding dataset biases without modeling
them [111.17078939377313]
最先端自然言語処理(NLP)モデルは、意図したタスクをターゲットとする機能ではなく、データセットのバイアスや表面形状の相関をモデル化することを学ぶことが多い。
これまでの研究は、バイアスに関する知識が利用できる場合に、これらの問題を回避するための効果的な方法を示してきた。
本稿では,これらの問題点を無視する学習モデルについて述べる。
論文 参考訳(メタデータ) (2020-12-02T16:10:54Z) - A theory of independent mechanisms for extrapolation in generative
models [20.794692397859755]
生成モデルは複雑な経験的データをエミュレートするために訓練することができるが、以前は観測されていなかった環境の文脈で予測するのに役立つだろうか?
我々は、メカニズムの独立原理に基づいて、より弱い識別可能性の形式を定義することによって、この課題に対処する理論的枠組みを開発する。
おもちゃの例では、古典的な勾配降下がモデルの外挿能力を阻害し、トレーニング中にメカニズムの独立性を明示的に実施すべきであることを示唆している。
論文 参考訳(メタデータ) (2020-04-01T01:01:43Z) - ICE-BeeM: Identifiable Conditional Energy-Based Deep Models Based on
Nonlinear ICA [11.919315372249802]
確率モデルの同定可能性理論を考察する。
我々は,独立に修飾されたコンポーネント分析の枠組みにおけるコンポーネントの推定に,我々のモデルを利用できることを示す。
論文 参考訳(メタデータ) (2020-02-26T14:43:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。