論文の概要: Sharp Thresholds of the Information Cascade Fragility Under a Mismatched
Model
- arxiv url: http://arxiv.org/abs/2006.04117v1
- Date: Sun, 7 Jun 2020 11:15:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 08:04:44.111792
- Title: Sharp Thresholds of the Information Cascade Fragility Under a Mismatched
Model
- Title(参考訳): ミスマッチモデルにおける情報カスケードフレギリティの鋭いしきい値
- Authors: Wasim Huleihel and Ofer Shayevitz
- Abstract要約: 我々は、意思決定者自身のプライベート情報と以前の意思決定者の行動に基づいて意思決定を行うシーケンシャルな意思決定モデルを分析する。
カスケードは、一部のプレイヤーが自身のプライベート情報を放棄し、以前のプレイヤーの行動を模倣するのが合理的であるように見えるときに発達する。
- 参考スコア(独自算出の注目度): 27.773088699678695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We analyze a sequential decision making model in which decision makers (or,
players) take their decisions based on their own private information as well as
the actions of previous decision makers. Such decision making processes often
lead to what is known as the \emph{information cascade} or \emph{herding}
phenomenon. Specifically, a cascade develops when it seems rational for some
players to abandon their own private information and imitate the actions of
earlier players. The risk, however, is that if the initial decisions were
wrong, then the whole cascade will be wrong. Nonetheless, information cascade
are known to be fragile: there exists a sequence of \emph{revealing}
probabilities $\{p_{\ell}\}_{\ell\geq1}$, such that if with probability
$p_{\ell}$ player $\ell$ ignores the decisions of previous players, and rely on
his private information only, then wrong cascades can be avoided. Previous
related papers which study the fragility of information cascades always assume
that the revealing probabilities are known to all players perfectly, which
might be unrealistic in practice. Accordingly, in this paper we study a
mismatch model where players believe that the revealing probabilities are
$\{q_\ell\}_{\ell\in\mathbb{N}}$ when they truly are
$\{p_\ell\}_{\ell\in\mathbb{N}}$, and study the effect of this mismatch on
information cascades. We consider both adversarial and probabilistic sequential
decision making models, and derive closed-form expressions for the optimal
learning rates at which the error probability associated with a certain
decision maker goes to zero. We prove several novel phase transitions in the
behaviour of the asymptotic learning rate.
- Abstract(参考訳): 我々は、意思決定者(またはプレイヤー)が自身のプライベート情報と以前の意思決定者の行動に基づいて意思決定を行うシーケンシャルな意思決定モデルを分析する。
このような意思決定プロセスは、しばしば \emph{information cascade} や \emph{herding} と呼ばれる現象に繋がる。
特に、カスケードは、一部のプレイヤーが自身の個人情報を放棄し、以前のプレイヤーの行動を模倣することが合理的であるように見えるときに発達する。
しかし、リスクは、最初の決定が間違っていれば、カスケード全体が間違ってしまうことである。
それにもかかわらず、情報カスケードは脆弱であることが知られている: \emph{revealing} 確率 $\{p_{\ell}\}_{\ell\geq1}$ のシーケンスが存在し、もし確率 $p_{\ell}$ player $\ell$ が以前のプレイヤーの決定を無視し、彼のプライベート情報のみに依存するなら、間違ったカスケードは避けられる。
情報カスケードの脆弱性を研究する以前の関連論文は、明らかな確率がすべてのプレイヤーに完全に知られていると常に仮定している。
そこで,本研究では,プレイヤーが真に$\{p_\ell\}_{\ell\in\mathbb{n}}$であるとき,その出現確率が$\{q_\ell\}_{\ell\in\mathbb{n}}$であると考えるミスマッチモデルを検討し,このミスマッチが情報カスケードに与える影響について検討する。
確率的意思決定モデルと確率的意思決定モデルの両方を考察し、ある意思決定者に関連する誤り確率がゼロとなる最適学習率のクローズドフォーム式を導出する。
我々は,漸近学習率の行動にいくつかの新しい位相遷移を証明した。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Experts Don't Cheat: Learning What You Don't Know By Predicting Pairs [35.92045337126979]
モデルに$p(Y|X)$を近似させる戦略を提案し、$widehatp_theta(Y|X)$と$p(Y|X)$の間の残りのギャップを推定する。
提案手法では,曖昧な画像分類,(合成)言語モデリング,部分観測可能なナビゲーションタスクなどにおいて,モデルがどの程度の知識を持っていないかを正確に推定する。
論文 参考訳(メタデータ) (2024-02-13T19:01:45Z) - Bandit-Feedback Online Multiclass Classification: Variants and Tradeoffs [32.29254118429081]
我々は,帯域幅フィードバックの下での最適誤りが,全情報ケースの最適誤りよりも少なくとも$O(k)$倍高いことを示す。
また、ランダム化学習者と決定論的学習者の間のギャップに対して、$tildeTheta(k)$のほぼ最適な境界を示す。
論文 参考訳(メタデータ) (2024-02-12T07:20:05Z) - Fundamental Bounds on Online Strategic Classification [13.442155854812528]
戦略設定において,決定論的アルゴリズムが$o(Delta)$の誤りを達成できないことを示す。
また、これを非依存の設定に拡張し、$Delta$乗法後悔のアルゴリズムを得る。
我々は,不愉快な,適応的な両敵に対して,サブ線形後悔境界を実現するランダム化アルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-02-23T22:39:43Z) - Reconciling Individual Probability Forecasts [78.0074061846588]
データに同意する2つの当事者は、個々の確率をモデル化する方法に異を唱えることができない。
個々の確率は不可知であるが、計算的かつデータ効率のよいプロセスで競合できると結論付ける。
論文 参考訳(メタデータ) (2022-09-04T20:20:35Z) - Risk Preferences of Learning Algorithms [0.0]
広く使われている学習アルゴリズムである$varepsilon$-Greedyは、突発的なリスク回避を示す。
このバイアスを修正する2つの方法について議論する。
論文 参考訳(メタデータ) (2022-05-10T01:30:24Z) - High Probability Bounds for a Class of Nonconvex Algorithms with AdaGrad
Stepsize [55.0090961425708]
本研究では,AdaGradのスムーズな非確率問題に対する簡易な高確率解析法を提案する。
我々はモジュラーな方法で解析を行い、決定論的設定において相補的な$mathcal O (1 / TT)$収束率を得る。
我々の知る限りでは、これは真に適応的なスキームを持つAdaGradにとって初めての高い確率である。
論文 参考訳(メタデータ) (2022-04-06T13:50:33Z) - Bandit Linear Optimization for Sequential Decision Making and
Extensive-Form Games [102.23975166536326]
tree-form sequential decision making (tfsdm) は、エージェントと潜在的に敵対的な環境の間のツリー形式の相互作用をモデル化することで、古典的なワンショット意思決定を拡張する。
これは、各プレイヤーが幅広い形式のゲームで直面するオンライン意思決定問題、およびマルコフ決定プロセス、およびエージェントが観測された履歴を条件とする部分観察可能なマルコフ決定プロセスをキャプチャする。
本稿では, (i) 線形時間損失と (ii) $o(sqrtt)$ cumulative regret の両方を提供する拡張dmのバンディット線形最適化問題に対する最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-08T05:00:13Z) - On Misspecification in Prediction Problems and Robustness via Improper
Learning [23.64462813525688]
広い種類の損失関数とパラメトリック分布の族に対して、"プロパ"予測子をプレイしたことの後悔は、少なくとも$sqrtgamma n$として境界スケーリングを下げていることが示される。
パラメトリックファミリーの凸体で分布を再生する可能性のあるすべての学習者の家族にしても、これは改善できない例を示します。
論文 参考訳(メタデータ) (2021-01-13T17:54:08Z) - Upper Confidence Primal-Dual Reinforcement Learning for CMDP with
Adversarial Loss [145.54544979467872]
マルコフ決定過程(CMDP)に対するオンライン学習の検討
本稿では,遷移モデルから標本化した軌跡のみを必要とする,新しいEmphupper confidence primal-dualアルゴリズムを提案する。
我々の分析では、ラグランジュ乗算過程の新たな高確率ドリフト解析を、高信頼強化学習の記念後悔解析に組み入れている。
論文 参考訳(メタデータ) (2020-03-02T05:02:23Z) - An Information-Theoretic Approach to Personalized Explainable Machine
Learning [92.53970625312665]
本稿では,予測とユーザ知識のための簡易確率モデルを提案する。
説明と予測の間の条件付き相互情報による説明の効果を定量化する。
論文 参考訳(メタデータ) (2020-03-01T13:06:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。