論文の概要: Post-ADC Inference: Valid Inference After Active Data Collection
- arxiv url: http://arxiv.org/abs/2605.11511v1
- Date: Tue, 12 May 2026 04:27:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.578397
- Title: Post-ADC Inference: Valid Inference After Active Data Collection
- Title(参考訳): ADC後推論: アクティブデータ収集後の検証推論
- Authors: Shuichi Nishino, Tomohiro Shiraishi, Teruyuki Katsuoka, Ichiro Takeuchi,
- Abstract要約: 本研究では,データ収集後のデータ依存的な方法で推定対象を構築した際の,アクティブな収集データに対する統計的推測について検討する。
本稿では、アクティブデータ収集プロセスとその後のデータ駆動型ターゲット構築の両方から生じるバイアスを考慮に入れた、ADC後推論を提案する。
提案手法は選択的推論に基づいて,2つのバイアス源に対して有効な$p$値と信頼区間を提供する。
- 参考スコア(独自算出の注目度): 9.892633657809785
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The validity of statistical inference depends critically on how data are collected. When data gathered through active data collection (ADC) are reused for a post-hoc inferential task, conventional inference can fail because the sampling is adaptively biased toward regions favored by the collection strategy. This issue is especially pronounced in black-box optimization, where sequential model-based optimization (SMBO) methods such as the tree-structured Parzen estimator (TPE) and Gaussian process upper confidence bound (GP-UCB) preferentially concentrate evaluations in promising regions. We study statistical inference on actively collected data when the inferential target is constructed in a data-dependent manner after data collection. To enable valid inference in this setting, we propose post-ADC inference, a framework that accounts for the biases arising from both the active data collection process and the subsequent data-driven target construction. Our method builds on selective inference and provides valid $p$-values and confidence intervals that correct for both sources of bias. The framework applies to a broad class of ADC processes by imposing only assumptions on the observation noise, without requiring any assumptions on the underlying black-box function or the surrogate model used by the SMBO algorithm. Empirical results also show that post-ADC inference provides valid inference for data collected by GP-UCB and TPE.
- Abstract(参考訳): 統計的推測の妥当性は、データの収集方法に大きく依存する。
アクティブデータ収集(ADC)を介して収集されたデータが、ポストホック推論タスクに再利用されると、サンプリングがコレクション戦略に好まれる領域に適応的に偏りがあるため、従来の推論が失敗する。
この問題は特にブラックボックス最適化において顕著であり、木構造パーゼン推定器(TPE)やガウス過程上信頼境界(GP-UCB)といった逐次モデルベース最適化(SMBO)手法は、将来性のある領域における評価を優先的に集中する。
本研究では,データ収集後のデータ依存的な方法で推定対象を構築した際の,アクティブな収集データに対する統計的推測について検討する。
この設定で有効な推論を可能にするために、アクティブデータ収集プロセスとその後のデータ駆動ターゲット構築の両方から生じるバイアスを考慮に入れた、ポストADC推論を提案する。
提案手法は選択的推論に基づいて,2つのバイアス源に対して有効な$p$値と信頼区間を提供する。
このフレームワークは、基盤となるブラックボックス関数やSMBOアルゴリズムで使用されるサロゲートモデルに関する仮定を必要とせず、観測ノイズに関する仮定のみを課すことにより、幅広いADCプロセスに適用される。
また, GP-UCB と TPE が収集したデータに対して, ADC 後推論が有効であることを示す実験結果も得られた。
関連論文リスト
- Learnable Chernoff Baselines for Inference-Time Alignment [64.81256817158851]
本稿では,指数関数的に傾いたカーネルから効率よく,およそサンプリングする方法として,Learnerable Chernoff Baselinesを紹介した。
理想的なモデルに対する全変量保証を確立し、LCBサンプリングが理想的拒絶サンプリングと密接に一致するような連続的および離散的な拡散設定を実証する。
論文 参考訳(メタデータ) (2026-02-08T00:09:40Z) - Robust Sampling for Active Statistical Inference [11.929391566298841]
アクティブ統計的推論はAI支援データ収集を用いた新しい推論手法である。
アクティブな統計的推測のためのロバストなサンプリング戦略を提案する。
本稿では,本手法の有効性を実データに示す。
論文 参考訳(メタデータ) (2025-11-12T05:18:36Z) - Measuring Model Performance in the Presence of an Intervention [11.381587523287495]
社会的影響アプリケーションのための多くのAIでは、結果に影響を与える介入の存在は評価に偏っている。
RCTはランダムに介入を割り当て、制御グループからのデータをバイアスのないモデル評価に使用できる。
本研究では, 治療群からのデータを重み付けし, 結果が得られないサンプルの分布を再現する非バイアスモデル評価手法であるニュアンスパラメータ重み付け(NPW)を提案する。
論文 参考訳(メタデータ) (2025-11-08T02:24:16Z) - Bayesian Semi-supervised Inference via a Debiased Modeling Approach [1.2833734915643464]
半教師付き(SS)設定における推論は,近年,近年のビッグデータ問題との関連性が高まっているため,大きな注目を集めている。
SS設定における人口平均を推定するためのベイズ的手法を提案する。
論文 参考訳(メタデータ) (2025-09-22T06:49:10Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Prediction De-Correlated Inference: A safe approach for post-prediction inference [0.8192907805418583]
この設定での推論はしばしばポスト述語推論と呼ばれる。
我々は,予測相関推論 (PDC) という,予測後条件下での統計的推論のための新しい仮定リーンフレームワークを提案する。
我々のアプローチは安全であり、PDCが任意のブラックボックス機械学習モデルに自動的に適応し、教師付き機械学習モデルよりも一貫して優れる。
論文 参考訳(メタデータ) (2023-12-11T16:04:48Z) - Federated Estimation of Causal Effects from Observational Data [19.657789891394504]
フェデレートされたデータソースを用いた因果推論のための新しいフレームワークを提案する。
我々は、異なるプライベートデータソースからの局所因果効果を中央集権化せずに評価し、統合する。
論文 参考訳(メタデータ) (2021-05-31T08:06:00Z) - Decomposed Adversarial Learned Inference [118.27187231452852]
我々は,DALI(Decomposed Adversarial Learned Inference)という新しいアプローチを提案する。
DALIは、データ空間とコード空間の両方の事前および条件分布を明示的に一致させる。
MNIST, CIFAR-10, CelebAデータセットにおけるDALIの有効性を検証する。
論文 参考訳(メタデータ) (2020-04-21T20:00:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。