論文の概要: Another look at inference after prediction
- arxiv url: http://arxiv.org/abs/2411.19908v2
- Date: Fri, 06 Dec 2024 15:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-09 15:54:27.299865
- Title: Another look at inference after prediction
- Title(参考訳): 予測後の推論について
- Authors: Jessica Gronsbell, Jianhui Gao, Yaqi Shi, Zachary R. McCaw, David Cheng,
- Abstract要約: 予測ベース(PB)推論は、関心の結果が得られにくいアプリケーションではますます使われている。
予測駆動推論(PPI)推定器の統計的効率について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Prediction-based (PB) inference is increasingly used in applications where the outcome of interest is difficult to obtain, but its predictors are readily available. Unlike traditional inference, PB inference performs statistical inference using a partially observed outcome and a set of covariates by leveraging a prediction of the outcome generated from a machine learning (ML) model. Motwani and Witten (2023) recently revisited two innovative PB inference approaches for ordinary least squares. They found that the method proposed by Wang et al. (2020) yields a consistent estimator for the association of interest when the ML model perfectly captures the underlying regression function. Conversely, the prediction-powered inference (PPI) method proposed by Angelopoulos et al. (2023) yields valid inference regardless of the model's accuracy. In this paper, we study the statistical efficiency of the PPI estimator. Our analysis reveals that a more efficient estimator, proposed 25 years ago by Chen and Chen (2000), can be obtained by simply adding a weight to the PPI estimator. We also contextualize PB inference with methods from the economics and statistics literature dating back to the 1960s. Our extensive theoretical and numerical analyses indicate that the Chen and Chen (CC) estimator offers a balance between robustness to ML model specification and statistical efficiency, making it the preferred choice for use in practice.
- Abstract(参考訳): 予測ベース(PB)推論は、関心の結果が得られにくいアプリケーションではますます使われているが、予測器は容易に利用できる。
従来の推論とは異なり、PB推論は、機械学習(ML)モデルから生成された結果の予測を活用することで、部分的に観察された結果と変量集合を用いて統計的推論を行う。
Motwani と Witten (2023) は、最近、通常の最小二乗に対する2つの革新的なPB推論アプローチを再考した。
We found that the method proposed by Wang et al (2020) yield a consistent estimator for the association of interest when the ML model completely capture the underlying regression function。
逆に、Angelopoulos et al (2023) によって提案された予測駆動推論(PPI)法は、モデルの正確性に関係なく有効な推論をもたらす。
本稿では,PPI推定器の統計的効率について検討する。
解析の結果,25年前にChen and Chen (2000) が提案したより効率的な推定器は,PPI推定器に重みを加えるだけで得られることがわかった。
また,1960年代までさかのぼる経済・統計学の手法によるPB推論についても検討した。
我々はChen and Chen (CC) 推定器を用いて,MLモデル仕様に対するロバスト性と統計的効率のバランスを図った。
関連論文リスト
- Predictability Analysis of Regression Problems via Conditional Entropy Estimations [1.8913544072080544]
回帰問題の予測可能性を評価するために,条件付きエントロピー推定器を開発した。
合成および実世界のデータセットの実験は、これらの推定器の堅牢性と有用性を示している。
論文 参考訳(メタデータ) (2024-06-06T07:59:19Z) - Revisiting inference after prediction [0.0]
本稿では,Angelopoulos et al. (2023) が提案する手法が,タイプ1エラー率の制御に成功し,精度のよい信頼区間を提供することを示す。
しかし、Wang et al. (2020) によって提案された手法は、非常に強い条件下でのみ有効な推論を提供するが、実際にはほとんど成り立たない。
論文 参考訳(メタデータ) (2023-06-23T19:06:50Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Benign-Overfitting in Conditional Average Treatment Effect Prediction
with Linear Regression [14.493176427999028]
線形回帰モデルを用いて条件平均処理効果(CATE)の予測における良性過剰適合理論について検討した。
一方,IPW-learnerは確率スコアが分かっていればリスクをゼロに収束させるが,T-learnerはランダムな割り当て以外の一貫性を達成できないことを示す。
論文 参考訳(メタデータ) (2022-02-10T18:51:52Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Counterfactual Predictions under Runtime Confounding [74.90756694584839]
本研究は, 過去のデータからすべての関連要因を抽出した環境で, 事実予測タスクについて検討する。
本稿では,この環境下での対実予測モデル学習のための2次ロバスト手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T15:49:05Z) - Nonparametric inverse probability weighted estimators based on the
highly adaptive lasso [0.966840768820136]
非パラメトリック逆確率重み付き推定器は非効率であり、次元性の呪いに苦しむことが知られている。
高度適応型ラッソのアンダースムーシングにより重み付け機構を推定する非パラメトリック逆確率重み付き推定器のクラスを提案する。
我々の開発は、大規模統計モデルと様々な問題設定における効率的な逆確率重み付き推定器の構築に幅広い意味を持つ。
論文 参考訳(メタデータ) (2020-05-22T17:49:46Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。