論文の概要: Power Analysis for Prediction-Powered Inference
- arxiv url: http://arxiv.org/abs/2603.16041v1
- Date: Tue, 17 Mar 2026 00:57:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.056428
- Title: Power Analysis for Prediction-Powered Inference
- Title(参考訳): 予測パワー推論のためのパワー分析
- Authors: Yiqun T. Chen, Moran Guo, Shengy Li,
- Abstract要約: 予測力の高い新しいAI/MLモデルを考えると、望ましい統計的パワーを達成するためにラベル付きサンプルはいくつ必要か?
我々は,PPI推定器のばらつきを特徴づけ,Waldテストインバージョンを適用して,必要なラベル付きサンプルサイズを求めることにより,閉形式電力公式を導出する。
解析式はモンテカルロシミュレーションを用いて検証し, 単細胞転写学, 臨床血圧測定, 皮膚顕微鏡画像にまたがる3つの現代の生体医学的応用の枠組みを概説した。
- 参考スコア(独自算出の注目度): 3.6704226968275253
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Modern studies increasingly leverage outcomes predicted by machine learning and artificial intelligence (AI/ML) models, and recent work, such as prediction-powered inference (PPI), has developed valid downstream statistical inference procedures. However, classical power and sample size formulas do not readily account for these predictions. In this work, we tackle a simple yet practical question: given a new AI/ML model with high predictive power, how many labeled samples are needed to achieve a desired level of statistical power? We derive closed-form power formulas by characterizing the asymptotic variance of the PPI estimator and applying Wald test inversion to obtain the required labeled sample size. Our results cover widely used settings including two-sample comparisons and risk measures in 2x2 tables. We find that a useful rule of thumb is that the reduction in required labeled samples relative to classical designs scales roughly with the R2 between the predictions and the ground truth. Our analytical formulas are validated using Monte Carlo simulations, and we illustrate the framework in three contemporary biomedical applications spanning single-cell transcriptomics, clinical blood pressure measurement, and dermoscopy imaging. We provide our software as an R package and online calculators at https://github.com/yiqunchen/pppower.
- Abstract(参考訳): 現代の研究は、機械学習と人工知能(AI/ML)モデルによって予測される結果をますます活用し、予測駆動推論(PPI)のような最近の研究は、下流の統計的推論の有効な手順を開発した。
しかし、古典的なパワーとサンプルサイズの公式はこれらの予測を容易には説明できない。
高い予測力を持つ新しいAI/MLモデルを考えると、望ましい統計的パワーを達成するためにラベル付きサンプルはいくつ必要か?
我々は,PPI推定器の漸近変動を特徴付け,Waldテストインバージョンを適用して,必要なラベル付きサンプルサイズを求めることにより,閉形式電力公式を導出する。
本研究は,2サンプル比較や2x2テーブルのリスク対策など,広く利用されている設定について検討した。
親指の有用な規則は、古典的な設計に対して必要となるラベル付きサンプルの削減が、予測と基底真理の間のR2と大まかに一致することである。
解析式はモンテカルロシミュレーションを用いて検証し, 単細胞転写学, 臨床血圧測定, 皮膚顕微鏡画像にまたがる3つの現代の生体医学的応用の枠組みを概説した。
我々はRパッケージとしてソフトウェアを提供し、https://github.com/yiqunchen/pppower.comでオンライン電卓を提供しています。
関連論文リスト
- Pre-validation Revisited [79.92204034170092]
シミュレーションと応用による予測,推測,誤差推定における事前検証の特性と利点を示す。
そこで本研究では, あるモデル下での事前検証予測のためのテスト統計量の解析的分布だけでなく, 推論を行うための一般的なブートストラップ手順も提案する。
論文 参考訳(メタデータ) (2025-05-21T00:20:14Z) - Prediction-Powered Adaptive Shrinkage Estimation [0.22917707112773592]
予測パワー適応収縮(英: Prediction-Powered Adaptive Shrinkage、PAS)は、PPIを実証的なベイズ収縮で橋渡しし、複数の手段の推定を改善する手法である。
PASはML予測の信頼性に適応し、大規模アプリケーションにおいて従来のベースラインと現代的なベースラインを上回っている。
論文 参考訳(メタデータ) (2025-02-20T00:24:05Z) - A Scalable Nyström-Based Kernel Two-Sample Test with Permutations [9.849635250118912]
2サンプル仮説テストは統計学と機械学習の基本的な問題である。
本研究では,最大平均誤差(MMD)のNystr "om approxation"を用いて,計算効率よく実用的なテストアルゴリズムを設計する。
論文 参考訳(メタデータ) (2025-02-19T09:22:48Z) - A Kernel-Based Conditional Two-Sample Test Using Nearest Neighbors (with Applications to Calibration, Regression Curves, and Simulation-Based Inference) [3.622435665395788]
本稿では,2つの条件分布の違いを検出するカーネルベースの尺度を提案する。
2つの条件分布が同じである場合、推定はガウス極限を持ち、その分散はデータから容易に推定できる単純な形式を持つ。
また、条件付き適合性問題に適用可能な推定値を用いた再サンプリングベースのテストも提供する。
論文 参考訳(メタデータ) (2024-07-23T15:04:38Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。