論文の概要: Statistical inference using Regularized M-estimation in the reproducing
kernel Hilbert space for handling missing data
- arxiv url: http://arxiv.org/abs/2107.07371v1
- Date: Thu, 15 Jul 2021 14:51:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-16 13:53:36.608277
- Title: Statistical inference using Regularized M-estimation in the reproducing
kernel Hilbert space for handling missing data
- Title(参考訳): 欠落データを扱うための再生核ヒルベルト空間における正規化m推定を用いた統計的推測
- Authors: Hengfang Wang and Jae Kwang Kim
- Abstract要約: まずカーネルリッジレグレッションを用いてアイテム非応答の処理を行う。
カーネルヒルベルト空間を用いた非パラメトリック確率スコア推定器も開発した。
提案手法は,中国北京で測定された大気汚染データを解析するためのものである。
- 参考スコア(独自算出の注目度): 0.76146285961466
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Imputation and propensity score weighting are two popular techniques for
handling missing data. We address these problems using the regularized
M-estimation techniques in the reproducing kernel Hilbert space. Specifically,
we first use the kernel ridge regression to develop imputation for handling
item nonresponse. While this nonparametric approach is potentially promising
for imputation, its statistical properties are not investigated in the
literature. Under some conditions on the order of the tuning parameter, we
first establish the root-$n$ consistency of the kernel ridge regression
imputation estimator and show that it achieves the lower bound of the
semiparametric asymptotic variance. A nonparametric propensity score estimator
using the reproducing kernel Hilbert space is also developed by a novel
application of the maximum entropy method for the density ratio function
estimation. We show that the resulting propensity score estimator is
asymptotically equivalent to the kernel ridge regression imputation estimator.
Results from a limited simulation study are also presented to confirm our
theory. The proposed method is applied to analyze the air pollution data
measured in Beijing, China.
- Abstract(参考訳): 計算と確率スコアの重み付けは、欠落データを扱う2つの一般的なテクニックである。
再現カーネルヒルベルト空間における正規化M推定手法を用いてこの問題に対処する。
具体的には、まずカーネルリッジレグレッションを用いてアイテム非応答の処理を行う。
この非パラメトリックなアプローチは計算に有望であるが、その統計的性質は文献では研究されていない。
チューニングパラメータの順序に関するいくつかの条件下では、まずカーネルリッジ回帰インプット推定器のルート=$n$一貫性を確立し、半パラメトリック漸近分散の下位境界を達成することを示す。
また、最大エントロピー法による密度比関数推定の新しい応用により、再生核ヒルベルト空間を用いた非パラメトリックプロペンシティスコア推定器を開発した。
得られた確率スコア推定器は,カーネルリッジ回帰インプット推定器と漸近的に等価であることを示す。
また,本理論を裏付けるために,限られたシミュレーション研究の結果も提示した。
提案手法は,中国北京における大気汚染データの解析に応用されている。
関連論文リスト
- Progression: an extrapolation principle for regression [0.0]
本稿では,新しい統計外挿原理を提案する。
これは、予測器とトレーニング予測器のサンプルの境界における応答との単純な関係を仮定する。
我々の半パラメトリック法である進行法は、この外挿原理を活用し、トレーニングデータ範囲を超えた近似誤差の保証を提供する。
論文 参考訳(メタデータ) (2024-10-30T17:29:51Z) - Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Kernel-based off-policy estimation without overlap: Instance optimality
beyond semiparametric efficiency [53.90687548731265]
本研究では,観測データに基づいて線形関数を推定するための最適手順について検討する。
任意の凸および対称函数クラス $mathcalF$ に対して、平均二乗誤差で有界な非漸近局所ミニマックスを導出する。
論文 参考訳(メタデータ) (2023-01-16T02:57:37Z) - Optimal policy evaluation using kernel-based temporal difference methods [78.83926562536791]
カーネルヒルベルト空間を用いて、無限水平割引マルコフ報酬過程の値関数を推定する。
我々は、関連するカーネル演算子の固有値に明示的に依存した誤差の非漸近上界を導出する。
MRP のサブクラスに対する minimax の下位境界を証明する。
論文 参考訳(メタデータ) (2021-09-24T14:48:20Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Statistical Inference after Kernel Ridge Regression Imputation under
item nonresponse [0.76146285961466]
カーネルリッジ回帰法による非パラメトリックな計算手法を考察し、一貫した分散推定を提案する。
提案した分散推定器はエントロピー法を用いて密度比を推定する線形化手法に基づいている。
論文 参考訳(メタデータ) (2021-01-29T20:46:33Z) - Early stopping and polynomial smoothing in regression with reproducing kernels [2.0411082897313984]
再生カーネルヒルベルト空間(RKHS)における反復学習アルゴリズムの早期停止問題について検討する。
本稿では,いわゆる最小不一致原理に基づく検証セットを使わずに早期停止を行うデータ駆動型ルールを提案する。
提案したルールは、異なるタイプのカーネル空間に対して、ミニマックス最適であることが証明されている。
論文 参考訳(メタデータ) (2020-07-14T05:27:18Z) - Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。
正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。
カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文 参考訳(メタデータ) (2020-05-20T15:01:03Z) - SLEIPNIR: Deterministic and Provably Accurate Feature Expansion for
Gaussian Process Regression with Derivatives [86.01677297601624]
本稿では,2次フーリエ特徴に基づく導関数によるGP回帰のスケーリング手法を提案する。
我々は、近似されたカーネルと近似された後部の両方に適用される決定論的、非漸近的、指数関数的に高速な崩壊誤差境界を証明した。
論文 参考訳(メタデータ) (2020-03-05T14:33:20Z) - Maximum likelihood estimation and uncertainty quantification for
Gaussian process approximation of deterministic functions [10.319367855067476]
本稿は、ガウス過程の回帰の文脈において、ノイズのないデータセットを用いた最初の理論的分析の1つを提供する。
本稿では,スケールパラメータのみの最大推定がガウス過程モデルの不特定に対する顕著な適応をもたらすことを示す。
論文 参考訳(メタデータ) (2020-01-29T17:20:21Z) - Statistical Inference for Model Parameters in Stochastic Gradient
Descent [45.29532403359099]
勾配降下係数(SGD)は,その計算効率とメモリ効率から,大規模データの統計的推定に広く用いられている。
人口減少関数が強い凸であり,一定の条件を満たす場合,SGDに基づく真のモデルパラメータの統計的推測の問題について検討する。
論文 参考訳(メタデータ) (2016-10-27T07:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。