論文の概要: On Suspicious Coincidences and Pointwise Mutual Information
- arxiv url: http://arxiv.org/abs/2203.08089v1
- Date: Tue, 15 Mar 2022 17:18:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 16:48:17.565585
- Title: On Suspicious Coincidences and Pointwise Mutual Information
- Title(参考訳): 疑わしい偶然とポイントワイズな相互情報について
- Authors: Christopher K. I. Williams
- Abstract要約: まず、古典的関連性尺度を2倍の2$の緊急度表でレビューする。
限界効果を除去すると、MI と PMI は $lambda$ の関数として $Y$ と同様に振る舞う。
- 参考スコア(独自算出の注目度): 6.03459316244618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Barlow (1985) hypothesized that the co-occurrence of two events $A$ and $B$
is "suspicious" if $P(A,B) \gg P(A) P(B)$. We first review classical measures
of association for $2 \times 2$ contingency tables, including Yule's $Y$ (Yule,
1912), which depends only on the odds ratio $\lambda$, and is independent of
the marginal probabilities of the table. We then discuss the mutual information
(MI) and pointwise mutual information (PMI), which depend on the ratio
$P(A,B)/P(A)P(B)$, as measures of association. We show that, once the effect of
the marginals is removed, MI and PMI behave similarly to $Y$ as functions of
$\lambda$. The pointwise mutual information is used extensively in some
research communities for flagging suspicious coincidences, but it is important
to bear in mind the sensitivity of the PMI to the marginals, with increased
scores for sparser events.
- Abstract(参考訳): Barlow (1985) は、2つの事象の共起が $A$ と $B$ であるなら、$P(A,B) \gg P(A) P(B)$ である、と仮定した。
最初に、2 の時間 2$ の共起テーブルに関する古典的測度をレビューし、例えばユールの$Y$ (Yule, 1912) は確率比$\lambda$ にのみ依存し、テーブルの限界確率には依存しない。
次に,P(A,B)/P(A)P(B)$の比率に依存する相互情報(MI)とポイントワイド相互情報(PMI)について,関連性の尺度として論じる。
限界効果を除去すると、MIとPMIは$\lambda$の関数として$Y$と同じような振る舞いをする。
ポイントワイドの相互情報は、疑わしい偶然を警告するために、いくつかの研究コミュニティで広く利用されているが、スペーサーイベントに対するPMIの感度を留意しておくことが重要である。
関連論文リスト
- Invariant Causal Prediction with Locally Linear Models [58.6243132840146]
観測データから対象変数の因果親を同定する作業を検討する。
親識別のための仮説テストに基づくLolicaPという実用的な手法を提案する。
我々は,LolicaPの統計的パワーが標本サイズにおいて指数関数的に高速に収束することを示す。
論文 参考訳(メタデータ) (2024-01-10T15:34:42Z) - Balancing central and marginal rejection when combining independent
significance tests [0.0]
p$-valuesのコレクションの重要性を評価するための一般的なアプローチは、それらをプーリング関数と組み合わせている。
p$-値の非ヌルな証拠の強さと頻度を伝達する一連の代替仮説が導入された。
中央の拒絶は常に限界の拒絶よりも大きいか等しいことが証明されており、両者のバランスを測る商を動機付けている。
論文 参考訳(メタデータ) (2023-10-25T12:45:49Z) - The most likely common cause [0.0]
2つの確率変数の共通原因原理である$A$と$B$は因果不整合の場合に検討される。
この状況に対して一般化された最大極大法が適用可能であることを示す。
2つの二項対称変数を調べると、条件付き確率の非解析的挙動が明らかになる。
論文 参考訳(メタデータ) (2023-06-30T11:20:37Z) - Near Sample-Optimal Reduction-based Policy Learning for Average Reward
MDP [58.13930707612128]
この研究は、平均報酬マルコフ決定過程(AMDP)における$varepsilon$-Optimal Policyを得る際のサンプルの複雑さを考察する。
我々は、状態-作用対当たりの$widetilde O(H varepsilon-3 ln frac1delta)$サンプルを証明し、$H := sp(h*)$は任意の最適ポリシーのバイアスのスパンであり、$varepsilon$は精度、$delta$は失敗確率である。
論文 参考訳(メタデータ) (2022-12-01T15:57:58Z) - Strange Correlation Function for Average Symmetry-Protected Topological
Phases [5.20303569294688]
我々は最近発見された平均対称性保護トポロジカル位相(ASPT)の奇妙な相関器を1d$と2d$で設計する。
奇妙な相関器は、密度行列 $rho$ が非自明な ASPT 相であるとき、長距離または強法的な振る舞いを持つ。
論文 参考訳(メタデータ) (2022-10-31T17:12:02Z) - Observable adjustments in single-index models for regularized
M-estimators [3.5353632767823506]
サンプルサイズが$n$ と dimension$p$ がともに増加するレジームでは、$hatbeta$ と予測値 $Xhatbeta$ の実証分布の振る舞いが以前特徴づけられた。
本稿では、$hatbeta$と$Xhatbeta$の実証分布を記述するために異なる理論を開発する。
論文 参考訳(メタデータ) (2022-04-14T14:32:02Z) - Optimal Membership Inference Bounds for Adaptive Composition of Sampled
Gaussian Mechanisms [93.44378960676897]
トレーニングされたモデルとデータサンプルが与えられた場合、メンバシップ推論(MI)アタックは、サンプルがモデルのトレーニングセットにあるかどうかを予測する。
MI攻撃に対する一般的な対策は、モデルトレーニング中に差分プライバシー(DP)を利用して個々の事例の存在を隠蔽することである。
本稿では,MI攻撃を装着した相手のテキスト・アドバンテージのバウンダリを導出し,広く利用されているガウス機構の厳密性を示す。
論文 参考訳(メタデータ) (2022-04-12T22:36:56Z) - Problem Dependent View on Structured Thresholding Bandit Problems [73.70176003598449]
我々は、Thresholding Bandit problem (TBP)における問題依存体制について検討する。
学習者の目的は、シーケンシャルゲームの終わりに、所定のしきい値を超える手段を持つアームセットを出力することである。
コンケーブ設定と単調設定の両方で誤差の確率を上下に設定する。
論文 参考訳(メタデータ) (2021-06-18T15:01:01Z) - The Curse of Passive Data Collection in Batch Reinforcement Learning [82.6026077420886]
高い利害関係のアプリケーションでは、アクティブな実験は危険すぎると考えられ、データはしばしば受動的に収集される。
バンディットやパッシブ、アクティブなデータ収集などの単純な場合も同様に効果的であるが、制御された状態のシステムからデータを集める場合、パッシブサンプリングの価格ははるかに高い。
論文 参考訳(メタデータ) (2021-06-18T07:54:23Z) - The Influence of Shape Constraints on the Thresholding Bandit Problem [74.73898216415049]
本稿では,いくつかの形状制約の下でThresholding Bandit問題(TBP)について検討する。
TBP問題において、目的は、シーケンシャルゲームの終わりに、所定のしきい値を超える手段を持つアームセットを出力することである。
後悔の最小値は (i) $sqrtlog(K)K/T$ for TBP, (ii) $sqrtlog(K)/T$ for UTBP, (iii) $sqrtK/T$ for CTBP, (iv) であることが証明されている。
論文 参考訳(メタデータ) (2020-06-17T17:12:32Z) - Weighted Empirical Risk Minimization: Sample Selection Bias Correction
based on Importance Sampling [2.599882743586164]
トレーニング観測値の分布$P'$が、最小化を目指すリスクに関わる分布$Z'_i$と異なる場合、統計的学習問題を考察する。
実際に頻繁に遭遇する様々な状況において、単純な形式を採り、$Phi(z)$から直接推定できることが示される。
次に、上記のアプローチのキャパシティ一般化が、その結果の$Phi(Z'_i)$'sを重み付き経験的リスクにプラグインするときに保持されることを示す。
論文 参考訳(メタデータ) (2020-02-12T18:42:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。