論文の概要: PPI is the Difference Estimator: Recognizing the Survey Sampling Roots of Prediction-Powered Inference
- arxiv url: http://arxiv.org/abs/2603.19160v1
- Date: Thu, 19 Mar 2026 17:16:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.292407
- Title: PPI is the Difference Estimator: Recognizing the Survey Sampling Roots of Prediction-Powered Inference
- Title(参考訳): PPIは差分推定器:予測パワー推論の根をサンプリングするサーベイの認識
- Authors: Reagan Mozer,
- Abstract要約: 予測駆動推論(英: Prediction-powered Inference、PPI)は、機械学習予測とゴールドスタンダードラベルを組み合わせて有効な統計的推論を行うための、急速に成長するフレームワークである。
本稿は,1970年代までさかのぼる調査文献から,PPIの根底にあるコア推定器は,十分に確立された推定器と等価であると主張している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prediction-powered inference (PPI) is a rapidly growing framework for combining machine learning predictions with a small set of gold-standard labels to conduct valid statistical inference. In this article, I argue that the core estimators underlying PPI are equivalent to well-established estimators from the survey sampling literature dating back to the 1970s. Specifically, the PPI estimator for a population mean is algebraically equivalent to the difference estimator of Cassel et al. (1976), and PPI plus corresponds to the generalized regression (GREG) estimator of Sarndal et al. (2003). Recognizing this equivalence, I consider what part of PPI is inherited from a long-standing literature in statistics, what part is genuinely new, and where inferential claims require care. After introducing the two frameworks and establishing their equivalence, I break down where PPI diverges from model-assisted estimation, including differences in the mode of inference, the role of the unlabeled data pool, and the consequences of differential prediction error for subgroup estimands such as the average treatment effect. I then identify what each framework offers the other: PPI researchers can draw on the survey sampling literature's well-developed theory of calibration, optimal allocation, and design-based diagnostics, while survey sampling researchers can benefit from PPI's extensions to non-standard estimands and its accessible software ecosystem. The article closes with a call for integration between these two communities, motivated by the growing use of large language models as measurement instruments in applied research.
- Abstract(参考訳): 予測駆動推論(英: Prediction-powered Inference、PPI)は、機械学習の予測と少数のゴールド標準ラベルを組み合わせて有効な統計的推論を行うための、急速に成長するフレームワークである。
本稿では,1970年代までさかのぼる調査文献から,PPIの根底にあるコア推定値が,十分に確立された推定値に相当することを論じる。
具体的には、集団平均に対する PPI 推定量は Cassel et al (1976) の差分推定器と代数的に等価であり、PPI プラスは Sarndal et al (2003) の一般化回帰 (GREG) 推定器に対応する。
この等価性を認識して、PPIのどの部分が長期にわたる統計文献から受け継がれているか、どの部分が真に新しいのか、そして推論的クレームがケアを必要とするのかを考えます。
2つの枠組みを導入し、その等価性を確立した後、PPIは、推論モードの違い、ラベルなしデータプールの役割、および平均処理効果などのサブグループの推定値に対する差分予測誤差の結果など、モデル支援推定から分岐する場所を断定する。
PPIの研究者は、校正、最適アロケーション、設計に基づく診断に関する、十分に発達した調査サンプリング文献の理論に基づいて、調査サンプリングの研究者は、PPIの非標準推定値への拡張と、そのアクセス可能なソフトウェアエコシステムの恩恵を受けることができます。
この論文は、応用研究における測定手段としての大規模言語モデルの利用の増加に動機づけられた、これらの2つのコミュニティの統合の呼びかけを締めくくっている。
関連論文リスト
- Generalized Prediction-Powered Inference, with Application to Binary Classifier Evaluation [0.0]
PPIを任意の正規線型推定器に一般化する。
PPIは、非常に制限的かつ非現実的なシナリオの外側の半パラメトリック効率を低くすることができないことを示す。
我々は、その文献との接続を利用して、修正されたPPI推定器を提案する。
論文 参考訳(メタデータ) (2026-02-10T22:11:26Z) - Demystifying Prediction Powered Inference [4.962232906170314]
予測パワー推論(英: Prediction-Powered Inference、PPI)は、大規模なラベルなしデータセットからの予測を活用して統計的効率を改善する、原則化されたフレームワークである。
その可能性にもかかわらず、PPIの変種の増加と両者の微妙な区別は、実践者がいつ、どのようにこれらの方法を適用するかを決定するのを困難にしている。
本稿では,PPIの理論的基礎,方法論的拡張,既存の統計文献への接続,診断ツールを統一的な実用的なワークフローに合成することによって,PPIをデミステレーションする。
論文 参考訳(メタデータ) (2026-01-28T18:16:02Z) - Practical Improvements of A/B Testing with Off-Policy Estimation [51.25970890274447]
従来の手法よりも分散度を低くする非バイアスのオフ・ポリティクス推定器のファミリーを導入する。
提案手法の有効性と実用性を理論的に検証した。
論文 参考訳(メタデータ) (2025-06-12T13:11:01Z) - Another look at inference after prediction [0.3457963934920459]
予測ベース(PB)推論は,大量の予測を用いた統計的解析に適合するように設計されている。
提案手法は, 簡易な修正により, 有効性の向上を保証できることを実証する。
本提案の実用性は,広範囲なシミュレーション研究と,英国バイオバンクの実データへの適用を通じて実証された。
論文 参考訳(メタデータ) (2024-11-29T18:12:50Z) - Regression for the Mean: Auto-Evaluation and Inference with Few Labels through Post-hoc Regression [4.813376208491175]
Prediction Powered Inference (PPI)フレームワークは、大量の擬似ラベル付きデータと、実際の高品質なラベルを持つ小さなサンプルの両方を活用する方法を提供する。
ラベル付きデータが不足すると、PPI++メソッドは古典的推論よりもさらにパフォーマンスが良くなる。
本稿では, 頑健な回帰器を用いたPPIに基づく2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-19T17:17:46Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Bayesian Prediction-Powered Inference [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
本稿では,ベイズ推定に基づくPPIのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-09T18:08:58Z) - Query Performance Prediction using Relevance Judgments Generated by Large Language Models [53.97064615557883]
自動生成関連判定(QPP-GenRE)を用いた新しいクエリ性能予測(QPP)フレームワークを提案する。
QPP-GenREは、QPPを独立したサブタスクに分解し、ランクリスト内の各項目の関連性を所定のクエリに予測する。
我々は,オープンソースの大規模言語モデル (LLM) を用いて,科学的妥当性を確保することにより,項目の関連性を予測する。
論文 参考訳(メタデータ) (2024-04-01T09:33:05Z) - Nonparametric Estimation of the Fisher Information and Its Applications [82.00720226775964]
本稿では,大きさn$のランダムサンプルからフィッシャー情報の位置推定の問題について考察する。
Bhattacharyaにより提案された推定器を再検討し、収束率の向上を導出する。
クリッピング推定器と呼ばれる新しい推定器を提案する。
論文 参考訳(メタデータ) (2020-05-07T17:21:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。