論文の概要: A Statistical Learning View of Simple Kriging
- arxiv url: http://arxiv.org/abs/2202.07365v5
- Date: Fri, 2 Feb 2024 09:42:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 21:02:45.010717
- Title: A Statistical Learning View of Simple Kriging
- Title(参考訳): 単純クリグの統計的学習観
- Authors: Emilia Siviero, Emilie Chautru, Stephan Cl\'emen\c{c}on
- Abstract要約: 統計的学習の観点から,簡単なKrigingタスクを解析する。
目標は、最小2次リスクで他の場所にある未知の値を予測することである。
我々は、真の最小化を模倣するプラグイン予測則の過剰なリスクに対して、$O_mathbbP (1/sqrtn)$の非漸近境界を証明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the Big Data era, with the ubiquity of geolocation sensors in particular,
massive datasets exhibiting a possibly complex spatial dependence structure are
becoming increasingly available. In this context, the standard probabilistic
theory of statistical learning does not apply directly and guarantees of the
generalization capacity of predictive rules learned from such data are left to
establish. We analyze here the simple Kriging task from a statistical learning
perspective, i.e. by carrying out a nonparametric finite-sample predictive
analysis. Given $d\geq 1$ values taken by a realization of a square integrable
random field $X=\{X_s\}_{s\in S}$, $S\subset \mathbb{R}^2$, with unknown
covariance structure, at sites $s_1,\; \ldots,\; s_d$ in $S$, the goal is to
predict the unknown values it takes at any other location $s\in S$ with minimum
quadratic risk. The prediction rule being derived from a training spatial
dataset: a single realization $X'$ of $X$, independent from those to be
predicted, observed at $n\geq 1$ locations $\sigma_1,\; \ldots,\; \sigma_n$ in
$S$. Despite the connection of this minimization problem with kernel ridge
regression, establishing the generalization capacity of empirical risk
minimizers is far from straightforward, due to the non independent and
identically distributed nature of the training data $X'_{\sigma_1},\; \ldots,\;
X'_{\sigma_n}$ involved in the learning procedure. In this article,
non-asymptotic bounds of order $O_{\mathbb{P}}(1/\sqrt{n})$ are proved for the
excess risk of a plug-in predictive rule mimicking the true minimizer in the
case of isotropic stationary Gaussian processes, observed at locations forming
a regular grid in the learning stage. These theoretical results are illustrated
by various numerical experiments, on simulated data and on real-world datasets.
- Abstract(参考訳): ビッグデータ時代には、特に位置情報センサーが普及するにつれて、複雑な空間依存構造を示す巨大なデータセットが利用できるようになる。
この文脈では、統計的学習の標準確率論は直接適用されず、そのようなデータから学習された予測規則の一般化能力の保証が確立される。
ここでは,非パラメトリックな有限サンプル予測解析を行うことで,統計学習の観点から単純なクリッピングタスクを解析する。
平方可積分確率場 $x=\{x_s\}_{s\in s}$, $s\subset \mathbb{r}^2$, with unknown covariance structure, at sites $s_1,\; \ldots,\; s_d$ in $s$ が与えられると、s\in s$ は最小の二次リスクを持つ任意の場所における未知の値を予測することを目的としている。
予測規則はトレーニング空間データセットから派生している: 単一の実現値$x'$が$x$で、予測対象と独立して、$n\geq 1$の場所$\sigma_1,\; \ldots,\; \sigma_n$ in $s$ で観測される。
この最小化問題とカーネルリッジ回帰との関連にもかかわらず、経験的リスク最小化器の一般化能力の確立は、学習手順に関わる訓練データ $x'_{\sigma_1},\; \ldots,\; x'_{\sigma_n}$ の非独立かつ同分布性のため、単純ではない。
本稿では、等方定常ガウス過程において真の最小化器を模倣するプラグイン予測規則の過剰なリスクについて、学習段階において正則格子を形成する場所で観察される、順序 $o_{\mathbb{p}}(1/\sqrt{n})$ の非漸近境界を証明する。
これらの理論結果は、シミュレーションデータと実世界のデータセットに関する様々な数値実験によって示される。
関連論文リスト
- Statistical-Computational Trade-offs for Density Estimation [60.81548752871115]
幅広い種類のデータ構造に対して、それらの境界は著しく改善されないことを示す。
これは密度推定のための新しい統計計算トレードオフである。
論文 参考訳(メタデータ) (2024-10-30T15:03:33Z) - Mean-Field Simulation-Based Inference for Cosmological Initial Conditions [4.520518890664213]
フーリエ空間における対角ガウス場に対する初期物質密度場の後方分布をモデル化したベイズ場再構成法を提案する。
トレーニングとサンプリングは非常に速い(トレーニング: $sim 1, Mathrmh$ on a GPU, sample: $lesssim 3, Mathrms$ for 1000 sample at resolution $1283$)。
論文 参考訳(メタデータ) (2024-10-21T09:23:50Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Sample-Efficient Linear Representation Learning from Non-IID Non-Isotropic Data [4.971690889257356]
コリンズとナイアーとヴァスワニによって提案された交互最小化・退化スキームの適応について紹介する。
iidにおいてもバニラ変動最小化降下は破滅的に失敗するが, 軽度に非等方性データは得られない。
我々の分析は、事前の作業を統一し、一般化し、幅広いアプリケーションに柔軟なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-08-08T17:56:20Z) - Effective Minkowski Dimension of Deep Nonparametric Regression: Function
Approximation and Statistical Theories [70.90012822736988]
ディープ非パラメトリック回帰に関する既存の理論は、入力データが低次元多様体上にある場合、ディープニューラルネットワークは本質的なデータ構造に適応できることを示した。
本稿では,$mathcalS$で表される$mathbbRd$のサブセットに入力データが集中するという緩和された仮定を導入する。
論文 参考訳(メタデータ) (2023-06-26T17:13:31Z) - $p$-Generalized Probit Regression and Scalable Maximum Likelihood
Estimation via Sketching and Coresets [74.37849422071206]
本稿では, 2次応答に対する一般化線形モデルである,$p$一般化プロビット回帰モデルについて検討する。
p$の一般化されたプロビット回帰に対する最大可能性推定器は、大容量データ上で$(1+varepsilon)$の係数まで効率的に近似できることを示す。
論文 参考訳(メタデータ) (2022-03-25T10:54:41Z) - Non-Asymptotic Guarantees for Robust Statistical Learning under
$(1+\varepsilon)$-th Moment Assumption [0.716879432974126]
本稿では,統計レグレッションの多種族を対象としたログトランケート型M-メチエータを提案する。
標準推定よりもログトランケート推定の方が優れていることを示す。
論文 参考訳(メタデータ) (2022-01-10T06:22:30Z) - Iterative Feature Matching: Toward Provable Domain Generalization with
Logarithmic Environments [55.24895403089543]
ドメインの一般化は、限られた数のトレーニング環境からのデータで、目に見えないテスト環境でうまく機能することを目的としています。
我々は,O(logd_s)$環境のみを見た後に一般化する予測器を高確率で生成することを保証する反復的特徴マッチングに基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-18T04:39:19Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z) - Weighted Empirical Risk Minimization: Sample Selection Bias Correction
based on Importance Sampling [2.599882743586164]
トレーニング観測値の分布$P'$が、最小化を目指すリスクに関わる分布$Z'_i$と異なる場合、統計的学習問題を考察する。
実際に頻繁に遭遇する様々な状況において、単純な形式を採り、$Phi(z)$から直接推定できることが示される。
次に、上記のアプローチのキャパシティ一般化が、その結果の$Phi(Z'_i)$'sを重み付き経験的リスクにプラグインするときに保持されることを示す。
論文 参考訳(メタデータ) (2020-02-12T18:42:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。