論文の概要: Prediction-Powered Adaptive Shrinkage Estimation
- arxiv url: http://arxiv.org/abs/2502.14166v1
- Date: Thu, 20 Feb 2025 00:24:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-21 14:28:49.052665
- Title: Prediction-Powered Adaptive Shrinkage Estimation
- Title(参考訳): 予測駆動型適応収縮推定
- Authors: Sida Li, Nikolaos Ignatiadis,
- Abstract要約: 予測パワー適応収縮(英: Prediction-Powered Adaptive Shrinkage、PAS)は、PPIを実証的なベイズ収縮で橋渡しし、複数の手段の推定を改善する手法である。
PASはML予測の信頼性に適応し、大規模アプリケーションにおいて従来のベースラインと現代的なベースラインを上回っている。
- 参考スコア(独自算出の注目度): 0.9208007322096532
- License:
- Abstract: Prediction-Powered Inference (PPI) is a powerful framework for enhancing statistical estimates by combining limited gold-standard data with machine learning (ML) predictions. While prior work has demonstrated PPI's benefits for individual statistical tasks, modern applications require answering numerous parallel statistical questions. We introduce Prediction-Powered Adaptive Shrinkage (PAS), a method that bridges PPI with empirical Bayes shrinkage to improve the estimation of multiple means. PAS debiases noisy ML predictions within each task and then borrows strength across tasks by using those same predictions as a reference point for shrinkage. The amount of shrinkage is determined by minimizing an unbiased estimate of risk, and we prove that this tuning strategy is asymptotically optimal. Experiments on both synthetic and real-world datasets show that PAS adapts to the reliability of the ML predictions and outperforms traditional and modern baselines in large-scale applications.
- Abstract(参考訳): 予測パワー推論(英: Prediction-Powered Inference, PPI)は、限られた金標準データと機械学習(ML)予測を組み合わせることで、統計的推定を強化する強力なフレームワークである。
従来の研究は、個々の統計タスクに対するPPIの利点を示してきたが、現代のアプリケーションは、多くの並列統計問題に答える必要がある。
本研究では,実証的なベイズ収縮でPPIを橋渡し,複数の手段の推定を改善する手法である予測パワー適応収縮法(PAS)を提案する。
PASは各タスク内でノイズの多いML予測を排除し、その後、それらの同じ予測を縮小の基準ポイントとして使用することにより、タスク間での強度を借用する。
リスクのバイアスのない推定を最小化することで収縮量を決定し、このチューニング戦略が漸近的に最適であることを示す。
合成データセットと実世界のデータセットの両方の実験では、PASがML予測の信頼性に適応し、大規模アプリケーションにおいて従来のベースラインと現代のベースラインを上回っていることが示されている。
関連論文リスト
- FAB-PPI: Frequentist, Assisted by Bayes, Prediction-Powered Inference [0.0]
予測駆動推論(PPI)は、実験データと機械学習予測を組み合わせることで、有効な統計的推測を可能にする。
本稿では,予測の質について事前の知識でPPIフレームワークに通知することを提案する。
その結果,ベイズ支援型PPI(FAB-PPI)は,観測された予測品質が従来よりも低い場合にPPIよりも改善されることがわかった。
論文 参考訳(メタデータ) (2025-02-04T14:46:08Z) - Predictions as Surrogates: Revisiting Surrogate Outcomes in the Age of AI [12.569286058146343]
我々は、生物統計学における数十年前の代理結果モデルと予測駆動推論(PPI)の新たな分野との正式な関係を確立する。
我々は、既存のPPI提案よりも効率的な統計的推論手法である、補正予測を用いた推論を開発する。
我々は,最先端の機械学習/AIモデルを活用した3つのアプリケーションを通じて,既存のPPI提案よりも有効サンプルサイズが大幅に向上したことを示す。
論文 参考訳(メタデータ) (2025-01-16T18:30:33Z) - Adaptive Sampling to Reduce Epistemic Uncertainty Using Prediction Interval-Generation Neural Networks [0.0]
本稿では,予測モデルにおけるてんかんの不確実性を低減するための適応サンプリング手法を提案する。
我々の主な貢献は、潜在的なてんかんの不確実性を推定する計量の開発である。
ガウス過程(GP)に基づくバッチサンプリング戦略も提案する。
本研究では, 実験肥料の施肥率を選択するために, 3つの一次元合成問題と, 農業分野に基づく多次元データセットについて検討した。
論文 参考訳(メタデータ) (2024-12-13T21:21:47Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Bayesian Prediction-Powered Inference [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
本稿では,ベイズ推定に基づくPPIのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-09T18:08:58Z) - Assumption-Lean and Data-Adaptive Post-Prediction Inference [1.5050365268347254]
本稿では,ML予測データに基づく有効かつ強力な推論を可能にするPoSt-Prediction Adaptive Inference (PSPA)を提案する。
シミュレーションと実データによる手法の統計的優位性と適用性を示す。
論文 参考訳(メタデータ) (2023-11-23T22:41:30Z) - PPI++: Efficient Prediction-Powered Inference [31.403415618169433]
PPI++: 小さなラベル付きデータセットと、通常より大きな機械学習予測データセットに基づく推定と推測の方法論を提案する。
これらの手法は、利用可能な予測の品質に自動的に適応し、容易に計算可能な信頼セットを得る。
PPI++は予測駆動推論(PPI)に基づいており、同じ問題設定をターゲットとし、計算効率と統計効率を改善している。
論文 参考訳(メタデータ) (2023-11-02T17:59:04Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。