論文の概要: Demystifying Prediction Powered Inference
- arxiv url: http://arxiv.org/abs/2601.20819v1
- Date: Wed, 28 Jan 2026 18:16:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-29 15:46:07.091359
- Title: Demystifying Prediction Powered Inference
- Title(参考訳): Demystifying Prediction Powered Inference
- Authors: Yilin Song, Dan M. Kluger, Harsh Parikh, Tian Gu,
- Abstract要約: 予測パワー推論(英: Prediction-Powered Inference、PPI)は、大規模なラベルなしデータセットからの予測を活用して統計的効率を改善する、原則化されたフレームワークである。
その可能性にもかかわらず、PPIの変種の増加と両者の微妙な区別は、実践者がいつ、どのようにこれらの方法を適用するかを決定するのを困難にしている。
本稿では,PPIの理論的基礎,方法論的拡張,既存の統計文献への接続,診断ツールを統一的な実用的なワークフローに合成することによって,PPIをデミステレーションする。
- 参考スコア(独自算出の注目度): 4.962232906170314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning predictions are increasingly used to supplement incomplete or costly-to-measure outcomes in fields such as biomedical research, environmental science, and social science. However, treating predictions as ground truth introduces bias while ignoring them wastes valuable information. Prediction-Powered Inference (PPI) offers a principled framework that leverages predictions from large unlabeled datasets to improve statistical efficiency while maintaining valid inference through explicit bias correction using a smaller labeled subset. Despite its potential, the growing PPI variants and the subtle distinctions between them have made it challenging for practitioners to determine when and how to apply these methods responsibly. This paper demystifies PPI by synthesizing its theoretical foundations, methodological extensions, connections to existing statistics literature, and diagnostic tools into a unified practical workflow. Using the Mosaiks housing price data, we show that PPI variants produce tighter confidence intervals than complete-case analysis, but that double-dipping, i.e. reusing training data for inference, leads to anti-conservative confidence intervals and coverages. Under missing-not-at-random mechanisms, all methods, including classical inference using only labeled data, yield biased estimates. We provide a decision flowchart linking assumption violations to appropriate PPI variants, a summary table of selective methods, and practical diagnostic strategies for evaluating core assumptions. By framing PPI as a general recipe rather than a single estimator, this work bridges methodological innovation and applied practice, helping researchers responsibly integrate predictions into valid inference.
- Abstract(参考訳): 機械学習の予測は、バイオメディカル研究、環境科学、社会科学などの分野における不完全または費用対効果を補うためにますます用いられる。
しかし、予測を根拠となる真実として扱うことは、価値ある情報を無視しながらバイアスをもたらす。
予測パワー推論(英: Prediction-Powered Inference、PPI)は、大きなラベル付きデータセットからの予測を活用して統計的効率を向上させるとともに、より小さなラベル付きサブセットを使用した明示的なバイアス補正を通じて有効な推論を維持する、原則化されたフレームワークである。
その可能性にもかかわらず、PPIの変種の増加と両者の微妙な区別は、実践者がいつ、どのようにこれらの方法を適用するかを決定するのを困難にしている。
本稿では,PPIの理論的基礎,方法論的拡張,既存の統計文献への接続,診断ツールを統一的な実用的なワークフローに合成することによって,PPIをデミステレーションする。
モサイクスの住宅価格データを用いて、PPIの変種は完全なケース分析よりも厳密な信頼区間を生成するが、二重ダイッピング、すなわち、推論のためのトレーニングデータを再利用することで、反保守的信頼区間とカバレッジをもたらす。
ランダムでないメカニズムの下では、ラベル付きデータのみを用いた古典的推論を含むすべてのメソッドがバイアス付き推定を生成する。
仮定違反を適切なPPI変種にリンクする決定フローチャート、選択法の概要表、およびコア仮定を評価するための実用的な診断戦略を提供する。
単一の推定器ではなく一般的なレシピとしてPPIをフレーミングすることで、この研究は方法論的な革新と応用の実践を橋渡しし、研究者が責任を持って予測を有効な推論に組み込むのに役立つ。
関連論文リスト
- Prediction-Powered Adaptive Shrinkage Estimation [0.22917707112773592]
予測パワー適応収縮(英: Prediction-Powered Adaptive Shrinkage、PAS)は、PPIを実証的なベイズ収縮で橋渡しし、複数の手段の推定を改善する手法である。
PASはML予測の信頼性に適応し、大規模アプリケーションにおいて従来のベースラインと現代的なベースラインを上回っている。
論文 参考訳(メタデータ) (2025-02-20T00:24:05Z) - Predictions as Surrogates: Revisiting Surrogate Outcomes in the Age of AI [12.569286058146343]
我々は、生物統計学における数十年前の代理結果モデルと予測駆動推論(PPI)の新たな分野との正式な関係を確立する。
我々は、既存のPPI提案よりも効率的な統計的推論手法である、補正予測を用いた推論を開発する。
我々は,最先端の機械学習/AIモデルを活用した3つのアプリケーションを通じて,既存のPPI提案よりも有効サンプルサイズが大幅に向上したことを示す。
論文 参考訳(メタデータ) (2025-01-16T18:30:33Z) - Another look at inference after prediction [0.3457963934920459]
予測ベース(PB)推論は,大量の予測を用いた統計的解析に適合するように設計されている。
提案手法は, 簡易な修正により, 有効性の向上を保証できることを実証する。
本提案の実用性は,広範囲なシミュレーション研究と,英国バイオバンクの実データへの適用を通じて実証された。
論文 参考訳(メタデータ) (2024-11-29T18:12:50Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Bayesian Prediction-Powered Inference [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
本稿では,ベイズ推定に基づくPPIのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-09T18:08:58Z) - Uncertainty-Aware Instance Reweighting for Off-Policy Learning [63.31923483172859]
本研究では,不確実性を考慮した逆確率スコア推定器 (UIPS) を提案する。
実世界の3つのレコメンデーションデータセットを用いた実験結果から,提案したUIPS推定器の有効サンプル効率が示された。
論文 参考訳(メタデータ) (2023-03-11T11:42:26Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。