論文の概要: Another look at inference after prediction
- arxiv url: http://arxiv.org/abs/2411.19908v3
- Date: Fri, 07 Feb 2025 19:27:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-11 14:27:03.367191
- Title: Another look at inference after prediction
- Title(参考訳): 予測後の推論について
- Authors: Jessica Gronsbell, Jianhui Gao, Yaqi Shi, Zachary R. McCaw, David Cheng,
- Abstract要約: 予測ベース(PB)推論は、少量の金標準データとともに、大量の予測を用いた統計的解析に適合するように設計されている。
PB推論の目標は、(i)予測における誤差からのバイアスを緩和し、(ii)金標準データのみを用いて従来の推論と比較して効率を改善することである。
簡単な修正で予測パワー推論(PPI)を調整し,理論的に正当化された効率改善を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: From structural biology to epidemiology, predictions from machine learning (ML) models increasingly complement costly gold-standard data to enable faster, more affordable, and scalable scientific inquiry. In response, prediction-based (PB) inference has emerged to accommodate statistical analysis using a large volume of predictions together with a small amount of gold-standard data. The goals of PB inference are two-fold: (i) to mitigate bias from errors in predictions and (ii) to improve efficiency relative to traditional inference using only the gold-standard data. Motwani and Witten (2023) recently revisited two key PB inference approaches and found that only one method, Prediction-powered Inference (PPI) proposed by Angelopoulos et al. (2023), achieves (i). In this paper, we find that PPI does not achieve (ii). We revisit the double sampling literature and show that, with a simple modification, PPI can be adjusted to provide theoretically justified improvements in efficiency. We also contextualize PB inference with economics and statistics literature dating back to the 1960s to highlight the utility of classical methods in this contemporary problem. Our extensive theoretical analyses, along with an analysis of UK Biobank data, indicate that our proposal effectively mitigates bias and improves efficiency, making it preferable for use in practice.
- Abstract(参考訳): 構造生物学から疫学まで、機械学習(ML)モデルからの予測は、より高速で安価でスケーラブルな科学的調査を可能にするために、コストのかかる金標準データを補完する傾向にある。
これに対し、予測ベース(PB)推論は、少量の金標準データとともに大量の予測を用いた統計的解析に適合する傾向にある。
PB推論の目標は2つある。
一 予測の誤りから偏見を和らげること
(二)金標準データのみを用いて従来の推論と比較して効率を向上させること。
Motwani と Witten (2023) は2つの主要なPB推論手法を再検討し、Angelopoulos et al (2023) によって提案された予測駆動推論 (PPI) の1つの方法のみが達成できることを発見した。
(i)。
本稿では,PPIが達成できないことを明らかにする。
(II)。
二重サンプリング文献を再検討し、簡単な修正でPPIを調整し、理論的に正当化された効率改善を提供することを示した。
また、1960年代までさかのぼる経済学や統計学の文献とのPB推論を文脈的に分析し、この現代問題における古典的手法の有用性を強調した。
我々の理論分析は、英国バイオバンクのデータの解析とともに、我々の提案がバイアスを効果的に軽減し、効率を向上し、実際にの使用に好適であることを示している。
関連論文リスト
- Prediction-Powered Adaptive Shrinkage Estimation [0.9208007322096532]
予測パワー適応収縮(英: Prediction-Powered Adaptive Shrinkage、PAS)は、PPIを実証的なベイズ収縮で橋渡しし、複数の手段の推定を改善する手法である。
PASはML予測の信頼性に適応し、大規模アプリケーションにおいて従来のベースラインと現代的なベースラインを上回っている。
論文 参考訳(メタデータ) (2025-02-20T00:24:05Z) - FAB-PPI: Frequentist, Assisted by Bayes, Prediction-Powered Inference [0.0]
予測駆動推論(PPI)は、実験データと機械学習予測を組み合わせることで、有効な統計的推測を可能にする。
本稿では,予測の質について事前の知識でPPIフレームワークに通知することを提案する。
その結果,ベイズ支援型PPI(FAB-PPI)は,観測された予測品質が従来よりも低い場合にPPIよりも改善されることがわかった。
論文 参考訳(メタデータ) (2025-02-04T14:46:08Z) - Predictions as Surrogates: Revisiting Surrogate Outcomes in the Age of AI [12.569286058146343]
我々は、生物統計学における数十年前の代理結果モデルと予測駆動推論(PPI)の新たな分野との正式な関係を確立する。
我々は、既存のPPI提案よりも効率的な統計的推論手法である、補正予測を用いた推論を開発する。
我々は,最先端の機械学習/AIモデルを活用した3つのアプリケーションを通じて,既存のPPI提案よりも有効サンプルサイズが大幅に向上したことを示す。
論文 参考訳(メタデータ) (2025-01-16T18:30:33Z) - Preference-Based Multi-Agent Reinforcement Learning: Data Coverage and Algorithmic Techniques [65.55451717632317]
PbMARL(Preference-based Multi-Agent Reinforcement Learning)について検討する。
一般ゲームにおける嗜好のみのオフラインデータセットからナッシュ平衡を同定する。
以上の結果から,PbMARLの多面的アプローチが示唆された。
論文 参考訳(メタデータ) (2024-09-01T13:14:41Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - PPI++: Efficient Prediction-Powered Inference [31.403415618169433]
PPI++: 小さなラベル付きデータセットと、通常より大きな機械学習予測データセットに基づく推定と推測の方法論を提案する。
これらの手法は、利用可能な予測の品質に自動的に適応し、容易に計算可能な信頼セットを得る。
PPI++は予測駆動推論(PPI)に基づいており、同じ問題設定をターゲットとし、計算効率と統計効率を改善している。
論文 参考訳(メタデータ) (2023-11-02T17:59:04Z) - Advancing Counterfactual Inference through Nonlinear Quantile Regression [77.28323341329461]
ニューラルネットワークで実装された効率的かつ効果的な対実的推論のためのフレームワークを提案する。
提案手法は、推定された反事実結果から見つからないデータまでを一般化する能力を高める。
複数のデータセットで実施した実証実験の結果は、我々の理論的な主張に対する説得力のある支持を提供する。
論文 参考訳(メタデータ) (2023-06-09T08:30:51Z) - Prediction-Oriented Bayesian Active Learning [51.426960808684655]
予測情報ゲイン(EPIG)は、パラメータではなく予測空間における情報ゲインを測定する。
EPIGは、さまざまなデータセットやモデルにわたるBALDと比較して、予測パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-04-17T10:59:57Z) - Excess risk analysis for epistemic uncertainty with application to
variational inference [110.4676591819618]
我々は、未知の分布からデータが生成される頻繁なセッティングにおいて、新しいEU分析を提示する。
一般化能力と、予測分布の分散やエントロピーなど、広く使用されているEUの測定値との関係を示す。
本研究では,PAC-ベイジアン理論に基づく予測とEU評価性能を直接制御する新しい変分推論を提案する。
論文 参考訳(メタデータ) (2022-06-02T12:12:24Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。