論文の概要: Spatially Robust Inference with Predicted and Missing at Random Labels
- arxiv url: http://arxiv.org/abs/2603.11368v1
- Date: Wed, 11 Mar 2026 23:14:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:25.708766
- Title: Spatially Robust Inference with Predicted and Missing at Random Labels
- Title(参考訳): ランダムラベルの予測と欠落を考慮した空間的ロバスト推論
- Authors: Stephen Salerno, Zhenke Wu, Tyler McCormick,
- Abstract要約: 交差フィットは空間分散推定器を歪ませ、不安定あるいは過度に保守的な信頼区間を生じる折りたたみレベルの相関を誘導することを示す。
また、折りたたみ雑音から依存を分離するジャックニフェ空間異方性と自動整合性(HAC)の分散補正を提案する。
- 参考スコア(独自算出の注目度): 2.5574009994099196
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: When outcome data are expensive or onerous to collect, scientists increasingly substitute predictions from machine learning and AI models for unlabeled cases, a process which has consequences for downstream statistical inference. While recent methods provide valid uncertainty quantification under independent sampling, real-world applications involve missing at random (MAR) labeling and spatial dependence. For inference in this setting, we propose a doubly robust estimator with cross-fit nuisances. We show that cross-fitting induces fold-level correlation that distorts spatial variance estimators, producing unstable or overly conservative confidence intervals. To address this, we propose a jackknife spatial heteroscedasticity and autocorrelation consistent (HAC) variance correction that separates spatial dependence from fold-induced noise. Under standard identification and dependence conditions, the resulting intervals are asymptotically valid. Simulations and benchmark datasets show substantial improvement in finite-sample calibration, particularly under MAR labeling and clustered sampling.
- Abstract(参考訳): 結果データが収集するのに費用がかかるか、あるいは煩雑な場合、研究者たちは、下流の統計的推測に結果をもたらすプロセスであるラベルのないケースに対して、機械学習とAIモデルから予測を代用する傾向にある。
近年の手法では、独立サンプリング下での有効な不確実性定量化が実現されているが、実世界のアプリケーションはランダムなラベリング(MAR)と空間的依存が欠落している。
この環境での推論のために、クロスフィットなニュアンスを持つ二重頑健な推定器を提案する。
交差フィットは空間分散推定器を歪ませ、不安定あるいは過度に保守的な信頼区間を生じる折りたたみレベルの相関を誘導することを示す。
そこで本稿では,空間依存を折り畳み雑音から分離する,ジャックニフェの空間的不整合性と自己相関整合性(HAC)の分散補正を提案する。
標準的な識別と依存条件の下では、結果として生じる間隔は漸近的に有効である。
シミュレーションとベンチマークデータセットは、特にMARラベルとクラスタ化サンプリングの下で、有限サンプルキャリブレーションを大幅に改善したことを示している。
関連論文リスト
- Fréchet regression of multivariate distributions with nonparanormal transport [5.388168357866664]
本稿では,多変量分布応答に対する新しい回帰手法を提案する。
我々は、NPTの理論的正当性を提供し、ワッサーシュタイン距離と位相的同値性を確立し、それが次元の呪いを緩和することを証明する。
本手法の実用性はシミュレーションと連続グルコースモニタリングデータへの応用により実証された。
論文 参考訳(メタデータ) (2026-03-07T03:21:12Z) - Semi-Supervised Regression with Heteroscedastic Pseudo-Labels [50.54050677867914]
両レベル最適化の観点から,疑似ラベルの影響を動的に調整する不確実性認識型擬似ラベル化フレームワークを提案する。
我々は、様々なベンチマークSSRデータセットにまたがって、我々のアプローチを検証するための理論的洞察と広範な実験を提供する。
論文 参考訳(メタデータ) (2025-10-17T03:06:23Z) - Penalized Empirical Likelihood for Doubly Robust Causal Inference under Contamination in High Dimensions [0.720409153108429]
低サンプルサイズ方程式における平均処理効果を2倍頑健に推定する手法を提案する。
提案した信頼区間は, 競合する推定値と比較して効率がよいことを示す。
論文 参考訳(メタデータ) (2025-07-23T11:58:54Z) - Error-quantified Conformal Inference for Time Series [55.11926160774831]
時系列予測の不確かさの定量化は、時系列データの時間的依存と分布シフトのために困難である。
量子化損失関数をスムースにすることで,iError-quantified Conformal Inference (ECI)を提案する。
ECIは有効な誤発見制御と、他のベースラインよりも厳密な予測セットを出力することができる。
論文 参考訳(メタデータ) (2025-02-02T15:02:36Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Distributional Shift-Aware Off-Policy Interval Estimation: A Unified
Error Quantification Framework [8.572441599469597]
本研究では、無限水平マルコフ決定過程の文脈における高信頼オフ政治評価について検討する。
目的は、未知の行動ポリシーから事前に収集されたオフラインデータのみを用いて、対象の政策値に対する信頼区間(CI)を確立することである。
提案アルゴリズムは, 非線形関数近似設定においても, サンプル効率, 誤差ローバスト, 既知収束性を示す。
論文 参考訳(メタデータ) (2023-09-23T06:35:44Z) - The Decaying Missing-at-Random Framework: Model Doubly Robust Causal Inference with Partially Labeled Data [8.916614661563893]
因果推論を両立させるために,MARフレームワークの欠落と関連するアプローチを導入する。
これはラベル付け機構における選択バイアスとラベル付きグループとラベルなしグループの極端な不均衡に同時に対処する。
因果関係の堅牢性を確保するため,平均治療効果に対するバイアス低減SS推定器を提案する。
論文 参考訳(メタデータ) (2023-05-22T07:37:12Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。