論文の概要: Smaller Confidence Intervals From IPW Estimators via Data-Dependent Coarsening
- arxiv url: http://arxiv.org/abs/2410.01658v1
- Date: Wed, 2 Oct 2024 15:25:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 16:13:24.579480
- Title: Smaller Confidence Intervals From IPW Estimators via Data-Dependent Coarsening
- Title(参考訳): データ依存型階層化によるIPW推定器からの信頼性の最小化
- Authors: Alkis Kalavasis, Anay Mehrotra, Manolis Zampetakis,
- Abstract要約: Inverse propensity-score weighted (IPW) 推定器は、観察研究における平均治療効果を推定するための因果推論において一般的である。
本稿では,既存のIPW推定器とその変種をキャプチャするCIPW推定器のファミリーを紹介する。
- 参考スコア(独自算出の注目度): 14.012018108833862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inverse propensity-score weighted (IPW) estimators are prevalent in causal inference for estimating average treatment effects in observational studies. Under unconfoundedness, given accurate propensity scores and $n$ samples, the size of confidence intervals of IPW estimators scales down with $n$, and, several of their variants improve the rate of scaling. However, neither IPW estimators nor their variants are robust to inaccuracies: even if a single covariate has an $\varepsilon>0$ additive error in the propensity score, the size of confidence intervals of these estimators can increase arbitrarily. Moreover, even without errors, the rate with which the confidence intervals of these estimators go to zero with $n$ can be arbitrarily slow in the presence of extreme propensity scores (those close to 0 or 1). We introduce a family of Coarse IPW (CIPW) estimators that captures existing IPW estimators and their variants. Each CIPW estimator is an IPW estimator on a coarsened covariate space, where certain covariates are merged. Under mild assumptions, e.g., Lipschitzness in expected outcomes and sparsity of extreme propensity scores, we give an efficient algorithm to find a robust estimator: given $\varepsilon$-inaccurate propensity scores and $n$ samples, its confidence interval size scales with $\varepsilon+1/\sqrt{n}$. In contrast, under the same assumptions, existing estimators' confidence interval sizes are $\Omega(1)$ irrespective of $\varepsilon$ and $n$. Crucially, our estimator is data-dependent and we show that no data-independent CIPW estimator can be robust to inaccuracies.
- Abstract(参考訳): Inverse propensity-score weighted (IPW) 推定器は、観察研究における平均治療効果を推定するための因果推論において一般的である。
正確な正当性スコアと$n$サンプルが与えられると、IPW推定器の信頼区間のサイズは$n$に縮小され、いくつかの変種はスケーリング率を改善する。
しかし、IPW推定器もその変種も不正確ではない:もし1つの共変量体が確率スコアに$\varepsilon>0$加法誤差を持っているとしても、これらの推定器の信頼区間のサイズは任意に増加する。
さらに、誤差がなくても、これらの推定器の信頼区間が 0 に$n$ になる速度は、極端な確率スコア(0 または 1 に近い)の存在下で任意に遅くすることができる。
本稿では,既存のIPW推定器とその変種をキャプチャするCIPW推定器のファミリーを紹介する。
各CIPW推定器は、ある共変数がマージされた粗い共変数空間上のIPW推定器である。
軽度の仮定、例えば、予想結果のリプシッツネスと極度の確率性スコアの間隔において、ロバストな推定子を見つけるための効率的なアルゴリズムを与える:$\varepsilon$-不正確な確率スコアと$n$サンプルが与えられると、その信頼区間サイズは$\varepsilon+1/\sqrt{n}$でスケールする。
対照的に、同じ仮定の下では、既存の推定者の信頼区間サイズは$\Omega(1)$で、$\varepsilon$と$n$とは無関係である。
重要なことは、我々の推定器はデータに依存しており、データに依存しないCIPW推定器は不正確性に対して堅牢であることを示す。
関連論文リスト
- Optimal score estimation via empirical Bayes smoothing [13.685846094715364]
未知確率分布$rho*$のスコア関数を$n$独立分布および$d$次元における同一分布観測から推定する問題について検討する。
ガウスカーネルに基づく正規化スコア推定器は、一致するミニマックス下界によって最適に示され、この値が得られることを示す。
論文 参考訳(メタデータ) (2024-02-12T16:17:40Z) - How Much is Unseen Depends Chiefly on Information About the Seen [2.169081345816618]
トレーニングデータに現れないクラスに属する未知の集団におけるデータポイントの割合は、トレーニングデータに同じ回数に現れるクラスの数$f_k$によってほぼ完全に決定される。
サンプルのみを用いて最小平均二乗誤差(MSE)を持つ推定器を探索する遺伝的アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-08T17:12:49Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Computationally and Statistically Efficient Truncated Regression [36.3677715543994]
計算的かつ統計的に効率的な線形回帰の古典的問題に対する推定器を提供する。
提案手法では, トランキャット標本の負の対数類似度に代わることなく, プロジェクテッド・Descent Gradient (PSGD) を用いて推定する。
本稿では,SGDが単一層ニューラルネットワークの雑音活性化関数のパラメータを学習することを示す。
論文 参考訳(メタデータ) (2020-10-22T19:31:30Z) - Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient
Estimator [93.05919133288161]
一般的なGumbel-Softmax推定器のストレートスルー変量の分散は、ラオ・ブラックウェル化により減少できることを示す。
これは平均二乗誤差を確実に減少させる。
これは分散の低減、収束の高速化、および2つの教師なし潜在変数モデルの性能向上につながることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-09T22:54:38Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z) - Nonparametric Estimation of the Fisher Information and Its Applications [82.00720226775964]
本稿では,大きさn$のランダムサンプルからフィッシャー情報の位置推定の問題について考察する。
Bhattacharyaにより提案された推定器を再検討し、収束率の向上を導出する。
クリッピング推定器と呼ばれる新しい推定器を提案する。
論文 参考訳(メタデータ) (2020-05-07T17:21:56Z) - SUMO: Unbiased Estimation of Log Marginal Probability for Latent
Variable Models [80.22609163316459]
無限級数のランダム化トランケーションに基づく潜在変数モデルに対して、ログ境界確率の非バイアス推定器とその勾配を導入する。
推定器を用いてトレーニングしたモデルは、同じ平均計算コストに対して、標準的な重要度サンプリングに基づくアプローチよりも優れたテストセット確率を与えることを示す。
論文 参考訳(メタデータ) (2020-04-01T11:49:30Z) - Estimating Gradients for Discrete Random Variables by Sampling without
Replacement [93.09326095997336]
我々は、置換のないサンプリングに基づいて、離散確率変数に対する期待値の偏りのない推定器を導出する。
推定器は3つの異なる推定器のラオ・ブラックウェル化として導出可能であることを示す。
論文 参考訳(メタデータ) (2020-02-14T14:15:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。