論文の概要: Learning functions varying along a central subspace
- arxiv url: http://arxiv.org/abs/2001.07883v3
- Date: Tue, 16 Nov 2021 08:51:23 GMT
- Title: Learning functions varying along a central subspace
- Title(参考訳): 中心部分空間に沿って変化する学習関数
- Authors: Hao Liu, Wenjing Liao
- Abstract要約: 多くの興味のある函数は高次元空間にあるが、低次元構造を持っている。
本稿では,$s$-H" 関数 $f$ in $mathbbRD$ の回帰について検討する。
直接近似の$f in $mathbbRD$と$varepsilon$の精度は$varepsilon(2s+D)/s$の順に$n$のサンプル数を必要とする。
- Abstract: Many functions of interest are in a high-dimensional space but exhibit
low-dimensional structures. This paper studies regression of a $s$-H\"{o}lder
function $f$ in $\mathbb{R}^D$ which varies along a central subspace of
dimension $d$ while $d\ll D$. A direct approximation of $f$ in $\mathbb{R}^D$
with an $\varepsilon$ accuracy requires the number of samples $n$ in the order
of $\varepsilon^{-(2s+D)/s}$. In this paper, we analyze the Generalized Contour
Regression (GCR) algorithm for the estimation of the central subspace and use
piecewise polynomials for function approximation. GCR is among the best
estimators for the central subspace, but its sample complexity is an open
question. We prove that GCR leads to a mean squared estimation error of
$O(n^{-1})$ for the central subspace, if a variance quantity is exactly known.
The estimation error of this variance quantity is also given in this paper. The
mean squared regression error of $f$ is proved to be in the order of
$\left(n/\log n\right)^{-\frac{2s}{2s+d}}$ where the exponent depends on the
dimension of the central subspace $d$ instead of the ambient space $D$. This
result demonstrates that GCR is effective in learning the low-dimensional
central subspace. We also propose a modified GCR with improved efficiency. The
convergence rate is validated through several numerical experiments.
- Abstract(参考訳): 多くの興味のある函数は高次元空間にあるが、低次元構造を持っている。
本稿では、$s$-H\"{o}lder function $f$ in $\mathbb{R}^D$の回帰について研究する。
$\varepsilon$の精度で$f$ in $\mathbb{r}^d$の直接近似は、$\varepsilon^{-(2s+d)/s}$の順に$n$のサンプル数を必要とする。
本稿では,中心部分空間を推定するための一般化輪郭回帰 (GCR) アルゴリズムを解析し,関数近似にピースワイズ多項式を用いる。
本論文では, この分散量の推定誤差についても述べる。
f$の平均二乗回帰誤差は$\left(n/\log n\right)^{-\frac{2s}{2s+d}}$の順であることが証明される。
