論文の概要: A Statistical Learning View of Simple Kriging
- arxiv url: http://arxiv.org/abs/2202.07365v1
- Date: Tue, 15 Feb 2022 12:46:43 GMT
- Title: A Statistical Learning View of Simple Kriging
- Title(参考訳): 単純クリグの統計的学習観
- Authors: Emilia Siviero, Emilie Chautru, Stephan Cl\'emen\c{c}on
- Abstract要約: ビッグデータ時代には、特に位置情報センサーが多用され、複雑な空間依存構造を示す巨大なデータセットが利用できるようになった。
O_mathbbP (1/n)$ の漸近的境界は、真の最小化を模倣するプラグイン予測則の過剰なリスクに対して証明される。
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the Big Data era, with the ubiquity of geolocation sensors in particular,
massive datasets exhibiting a possibly complex spatial dependence structure are
becoming increasingly available. In this context, the standard probabilistic
theory of statistical learning does not apply directly and guarantees of the
generalization capacity of predictive rules learned from such data are left to
establish. We analyze here the simple Kriging task, the flagship problem in
Geostatistics: the values of a square integrable random field $X=\{X_s\}_{s\in
S}$, $S\subset \mathbb{R}^2$, with unknown covariance structure are to be
predicted with minimum quadratic risk, based upon observing a single
realization of the spatial process at a finite number of locations $s_1,\;
\ldots,\; s_n$ in $S$. Despite the connection of this minimization problem with
kernel ridge regression, establishing the generalization capacity of empirical
risk minimizers is far from straightforward, due to the non i.i.d. nature of
the spatial data $X_{s_1},\; \ldots,\; X_{s_n}$ involved. In this article,
nonasymptotic bounds of order $O_{\mathbb{P}}(1/n)$ are proved for the excess
risk of a plug-in predictive rule mimicking the true minimizer in the case of
isotropic stationary Gaussian processes observed at locations forming a regular
grid. These theoretical results, as well as the role played by the technical
conditions required to establish them, are illustrated by various numerical
experiments and hopefully pave the way for further developments in statistical
learning based on spatial data.
- Abstract(参考訳): ビッグデータ時代には、特に位置情報センサーが普及するにつれて、複雑な空間依存構造を示す巨大なデータセットが利用できるようになる。
平方可積分な乱体 $X=\{X_s\}_{s\in S}$, $S\subset \mathbb{R}^2$, 未知の共分散構造を持つ値は、空間過程の有限個の位置 $s_1,\; \ldots,\; s_n$ in $S$ で空間過程の単一実現を観測することにより、最小2次リスクで予測される。
この最小化問題とカーネルリッジ回帰との接続にもかかわらず、経験的リスク最小化器の一般化能力を確立することは、空間データ $X_{s_1},\; \ldots,\; X_{s_n}$ の非自然性のため、決して簡単ではない。
本稿では、正則格子を形成する場所で観測される等方定常ガウス過程の場合、真の最小化器を模倣するプラグイン予測則の過剰なリスクに対して、順序 $o_{\mathbb{p}}(1/n)$ の非漸近境界が証明される。
