論文の概要: Do More Predictions Improve Statistical Inference? Filtered Prediction-Powered Inference
- arxiv url: http://arxiv.org/abs/2602.10464v1
- Date: Wed, 11 Feb 2026 03:02:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.416391
- Title: Do More Predictions Improve Statistical Inference? Filtered Prediction-Powered Inference
- Title(参考訳): さらなる予測は統計的推論を改善するか?
- Authors: Shirong Xu, Will Wei Sun,
- Abstract要約: Filtered Prediction-Powered Inference (FPPI) は、データ適応型フィルタリング領域を特定して予測を選択的に組み込むフレームワークである。
FPPIは、信頼性のある予測を選択的に活用することで、高価なラベルへの依存を大幅に低減する。
- 参考スコア(独自算出の注目度): 1.495380389108477
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in artificial intelligence have enabled the generation of large-scale, low-cost predictions with increasingly high fidelity. As a result, the primary challenge in statistical inference has shifted from data scarcity to data reliability. Prediction-powered inference methods seek to exploit such predictions to improve efficiency when labeled data are limited. However, existing approaches implicitly adopt a use-all philosophy, under which incorporating more predictions is presumed to improve inference. When prediction quality is heterogeneous, this assumption can fail, and indiscriminate use of unlabeled data may dilute informative signals and degrade inferential accuracy. In this paper, we propose Filtered Prediction-Powered Inference (FPPI), a framework that selectively incorporates predictions by identifying a data-adaptive filtered region in which predictions are informative for inference. We show that this region can be consistently estimated under a margin condition, achieving fast rates of convergence. By restricting the prediction-powered correction to the estimated filtered region, FPPI adaptively mitigates the impact of biased or noisy predictions. We establish that FPPI attains strictly improved asymptotic efficiency compared with existing prediction-powered inference methods. Numerical studies and a real-data application to large language model evaluation demonstrate that FPPI substantially reduces reliance on expensive labels by selectively leveraging reliable predictions, yielding accurate inference even in the presence of heterogeneous prediction quality.
- Abstract(参考訳): 人工知能の最近の進歩により、ますます忠実度の高い大規模で低コストな予測が生み出されるようになった。
その結果、統計的推論の主な課題は、データの不足からデータの信頼性に移行した。
予測を用いた推論手法は、ラベル付きデータが制限された場合の効率を改善するために、そのような予測を活用する。
しかしながら、既存のアプローチでは、推論を改善するためにより多くの予測を組み込むという、すべての使用哲学を暗黙的に採用している。
予測品質が不均一な場合、この仮定は失敗し、ラベルなしデータの無差別使用は情報信号の希薄化と推論精度の低下を引き起こす。
本稿では,データ適応型フィルタ領域を同定し,予測を選択的に組み込むフレームワークであるFPPIを提案する。
この領域はマージン条件下で連続的に推定でき、収束速度が速いことを示す。
予測による補正を推定されたフィルタ領域に限定することにより、FPPIはバイアスやノイズの予測の影響を適応的に緩和する。
我々はFPPIが既存の予測による推論手法と比較して高度に漸近効率を向上できることを証明した。
大規模言語モデル評価への数値的研究と実データの適用により、FPPIは信頼性の高い予測を選択的に活用し、不均一な予測品質が存在する場合でも正確な推論を行うことにより、高価なラベルへの依存を著しく低減することを示した。
関連論文リスト
- Demystifying Prediction Powered Inference [4.962232906170314]
予測パワー推論(英: Prediction-Powered Inference、PPI)は、大規模なラベルなしデータセットからの予測を活用して統計的効率を改善する、原則化されたフレームワークである。
その可能性にもかかわらず、PPIの変種の増加と両者の微妙な区別は、実践者がいつ、どのようにこれらの方法を適用するかを決定するのを困難にしている。
本稿では,PPIの理論的基礎,方法論的拡張,既存の統計文献への接続,診断ツールを統一的な実用的なワークフローに合成することによって,PPIをデミステレーションする。
論文 参考訳(メタデータ) (2026-01-28T18:16:02Z) - Distribution-informed Online Conformal Prediction [53.674678995825666]
更新ルールに基礎となるデータパターンを組み込んだオンラインコンフォメーション予測アルゴリズムである Conformal Optimistic Prediction (COP) を提案する。
COPは予測可能なパターンが存在する場合により厳密な予測セットを生成し、見積もりが不正確な場合でも有効なカバレッジ保証を保持する。
我々は,COPが有効なカバレッジを実現し,他のベースラインよりも短い予測間隔を構築できることを証明した。
論文 参考訳(メタデータ) (2025-12-08T17:51:49Z) - Prediction-Powered Adaptive Shrinkage Estimation [0.22917707112773592]
予測パワー適応収縮(英: Prediction-Powered Adaptive Shrinkage、PAS)は、PPIを実証的なベイズ収縮で橋渡しし、複数の手段の推定を改善する手法である。
PASはML予測の信頼性に適応し、大規模アプリケーションにおいて従来のベースラインと現代的なベースラインを上回っている。
論文 参考訳(メタデータ) (2025-02-20T00:24:05Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。