論文の概要: Robust Sampling for Active Statistical Inference
- arxiv url: http://arxiv.org/abs/2511.08991v1
- Date: Thu, 13 Nov 2025 01:24:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.345315
- Title: Robust Sampling for Active Statistical Inference
- Title(参考訳): アクティブ統計的推論のためのロバストサンプリング
- Authors: Puheng Li, Tijana Zrnic, Emmanuel Candès,
- Abstract要約: アクティブ統計的推論はAI支援データ収集を用いた新しい推論手法である。
アクティブな統計的推測のためのロバストなサンプリング戦略を提案する。
本稿では,本手法の有効性を実データに示す。
- 参考スコア(独自算出の注目度): 11.929391566298841
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active statistical inference is a new method for inference with AI-assisted data collection. Given a budget on the number of labeled data points that can be collected and assuming access to an AI predictive model, the basic idea is to improve estimation accuracy by prioritizing the collection of labels where the model is most uncertain. The drawback, however, is that inaccurate uncertainty estimates can make active sampling produce highly noisy results, potentially worse than those from naive uniform sampling. In this work, we present robust sampling strategies for active statistical inference. Robust sampling ensures that the resulting estimator is never worse than the estimator using uniform sampling. Furthermore, with reliable uncertainty estimates, the estimator usually outperforms standard active inference. This is achieved by optimally interpolating between uniform and active sampling, depending on the quality of the uncertainty scores, and by using ideas from robust optimization. We demonstrate the utility of the method on a series of real datasets from computational social science and survey research.
- Abstract(参考訳): アクティブ統計的推論はAI支援データ収集を用いた新しい推論手法である。
収集可能なラベル付きデータポイントの数に関する予算と、AI予測モデルへのアクセスを想定した基本的な考え方は、モデルが最も不確実なラベルの収集を優先順位付けすることで、推定精度を向上させることである。
しかし欠点は、不正確な不確実性推定がアクティブサンプリングを非常にノイズの多い結果にしうることである。
本研究では,アクティブな統計的推測のためのロバストなサンプリング戦略を提案する。
ロバストサンプリングは、結果として生じる推定値が、一様サンプリングを用いた推定値よりも決して悪くならないことを保証している。
さらに、確実な不確実性推定では、推定器は通常標準のアクティブな推論よりも優れている。
これは、均一サンプリングとアクティブサンプリングを最適に補間し、不確実性スコアの品質に依存し、ロバストな最適化のアイデアを使用することによって達成される。
本稿では,計算社会科学と調査研究から得られた一連の実データに対して,本手法の有効性を実証する。
関連論文リスト
- Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Uncertainty for Active Learning on Graphs [70.44714133412592]
不確実性サンプリングは、機械学習モデルのデータ効率を改善することを目的とした、アクティブな学習戦略である。
予測の不確実性を超えた不確実性サンプリングをベンチマークし、他のアクティブラーニング戦略に対する大きなパフォーマンスギャップを強調します。
提案手法は,データ生成プロセスの観点から基幹的ベイズ不確実性推定法を開発し,不確実性サンプリングを最適クエリへ導く上での有効性を実証する。
論文 参考訳(メタデータ) (2024-05-02T16:50:47Z) - Active Statistical Inference [14.00987234726578]
方法論は、どのデータポイントがラベルにとって最も有益かを特定するために、機械学習モデルを使用する。
既存のベースラインよりもはるかに少ないサンプルで、同じレベルの精度を達成する。
論文 参考訳(メタデータ) (2024-03-05T18:46:50Z) - Uncertainty-Aware Instance Reweighting for Off-Policy Learning [63.31923483172859]
本研究では,不確実性を考慮した逆確率スコア推定器 (UIPS) を提案する。
実世界の3つのレコメンデーションデータセットを用いた実験結果から,提案したUIPS推定器の有効サンプル効率が示された。
論文 参考訳(メタデータ) (2023-03-11T11:42:26Z) - Statistical Inference After Adaptive Sampling for Longitudinal Data [9.468593929311867]
本研究では,Z推定による適応的なサンプルデータに対して,様々な統計的解析を行う新しい手法を開発した。
本研究は, 実験プロセスのための新しい理論ツールを開発し, 個別の関心を持つ可能性のある, 適応的にサンプル化された長手データについて述べる。
論文 参考訳(メタデータ) (2022-02-14T23:48:13Z) - Robust Validation: Confident Predictions Even When Distributions Shift [19.327409270934474]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。
本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。
私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文 参考訳(メタデータ) (2020-08-10T17:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。