論文の概要: Spectral Statistics of the Sample Covariance Matrix for High Dimensional
Linear Gaussians
- arxiv url: http://arxiv.org/abs/2312.05794v1
- Date: Sun, 10 Dec 2023 06:55:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 18:40:09.998425
- Title: Spectral Statistics of the Sample Covariance Matrix for High Dimensional
Linear Gaussians
- Title(参考訳): 高次元線形ガウス系におけるサンプル共分散行列のスペクトル統計
- Authors: Muhammad Abdullah Naeem, Miroslav Pajic
- Abstract要約: 高次元安定状態遷移行列の予言のための通常最小二乗法(OLS)の性能
OLS推定器は、遠相遷移を発生させ、遠相遷移となり、推定誤差を悪化させるだけである。
- 参考スコア(独自算出の注目度): 12.524855369455421
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Performance of ordinary least squares(OLS) method for the \emph{estimation of
high dimensional stable state transition matrix} $A$(i.e., spectral radius
$\rho(A)<1$) from a single noisy observed trajectory of the linear time
invariant(LTI)\footnote{Linear Gaussian (LG) in Markov chain literature} system
$X_{-}:(x_0,x_1, \ldots,x_{N-1})$ satisfying \begin{equation}
x_{t+1}=Ax_{t}+w_{t}, \hspace{10pt} \text{ where } w_{t} \thicksim
N(0,I_{n}), \end{equation}
heavily rely on negative moments of the sample covariance matrix:
$(X_{-}X_{-}^{*})=\sum_{i=0}^{N-1}x_{i}x_{i}^{*}$ and singular values of
$EX_{-}^{*}$, where $E$ is a rectangular Gaussian ensemble $E=[w_0, \ldots,
w_{N-1}]$. Negative moments requires sharp estimates on all the eigenvalues
$\lambda_{1}\big(X_{-}X_{-}^{*}\big) \geq \ldots \geq
\lambda_{n}\big(X_{-}X_{-}^{*}\big) \geq 0$. Leveraging upon recent results on
spectral theorem for non-Hermitian operators in \cite{naeem2023spectral}, along
with concentration of measure phenomenon and perturbation theory(Gershgorins'
and Cauchys' interlacing theorem) we show that only when $A=A^{*}$, typical
order of $\lambda_{j}\big(X_{-}X_{-}^{*}\big) \in \big[N-n\sqrt{N},
N+n\sqrt{N}\big]$ for all $j \in [n]$. However, in \emph{high dimensions} when
$A$ has only one distinct eigenvalue $\lambda$ with geometric multiplicity of
one, then as soon as eigenvalue leaves \emph{complex half unit disc}, largest
eigenvalue suffers from curse of dimensionality:
$\lambda_{1}\big(X_{-}X_{-}^{*}\big)=\Omega\big( \lfloor\frac{N}{n}\rfloor
e^{\alpha_{\lambda}n} \big)$, while smallest eigenvalue
$\lambda_{n}\big(X_{-}X_{-}^{*}\big) \in (0, N+\sqrt{N}]$. Consequently, OLS
estimator incurs a \emph{phase transition} and becomes \emph{transient:
increasing iteration only worsens estimation error}, all of this happening when
the dynamics are generated from stable systems.
- Abstract(参考訳): Performance of ordinary least squares(OLS) method for the \emph{estimation of high dimensional stable state transition matrix} $A$(i.e., spectral radius $\rho(A)<1$) from a single noisy observed trajectory of the linear time invariant(LTI)\footnote{Linear Gaussian (LG) in Markov chain literature} system $X_{-}:(x_0,x_1, \ldots,x_{N-1})$ satisfying \begin{equation} x_{t+1}=Ax_{t}+w_{t}, \hspace{10pt} \text{ where } w_{t} \thicksim N(0,I_{n}), \end{equation} heavily rely on negative moments of the sample covariance matrix: $(X_{-}X_{-}^{*})=\sum_{i=0}^{N-1}x_{i}x_{i}^{*}$ and singular values of $EX_{-}^{*}$, where $E$ is a rectangular Gaussian ensemble $E=[w_0, \ldots, w_{N-1}]$.
負のモーメントはすべての固有値 $\lambda_{1}\big(X_{-}X_{-}^{*}\big) \geq \ldots \geq \lambda_{n}\big(X_{-}X_{-}^{*}\big) \geq 0$ に対して鋭い推定を必要とする。
測度現象と摂動理論(gershgorins' と cauchys' interlacing theorem)の集中とともに、 \cite{naeem2023spectral} における非エルミート作用素のスペクトル定理の最近の結果を利用して、$a=a^{*}$ のときのみ、$\lambda_{j}\big(x_{-}x_{-}^{*}\big) \in \big[n-n\sqrt{n}, n+n\sqrt{n}\big]$ の典型的な順序がすべての$j \in [n]$ であることを示した。
しかし \emph{high dimension} において、$a$ が1つの異なる固有値 $\lambda$ と1つの幾何学的多重性を持つとき、固有値が \emph{complex half unit disc} を去ると、最大の固有値が次元の呪いに苦しむ: $\lambda_{1}\big(x_{-}x_{-}^{*}\big)=\omega\big( \lfloor\frac{n}{n}\rfloor e^{\alpha_{\lambda}n} \big)$, 最小の固有値 $\lambda_{n}\big(x_{-}x_{-}^{*}\big) \in (0,n+\sqrt{n}]$ である。
したがって、ols推定器は \emph{phase transition} を発生させ、 \emph{transient: increasing iteration only worsens estimation error} となる。
関連論文リスト
- Efficient Continual Finite-Sum Minimization [52.5238287567572]
連続有限サム最小化(continuous finite-sum minimization)と呼ばれる有限サム最小化の鍵となるツイストを提案する。
我々のアプローチは$mathcalO(n/epsilon)$ FOs that $mathrmStochasticGradientDescent$で大幅に改善されます。
また、$mathcalOleft(n/epsilonalpharight)$ complexity gradient for $alpha 1/4$という自然な一階法は存在しないことを証明し、この方法の第一階法がほぼ密であることを示す。
論文 参考訳(メタデータ) (2024-06-07T08:26:31Z) - Dimension Independent Disentanglers from Unentanglement and Applications [55.86191108738564]
両部非絡み込み入力から次元独立なk-パーティイトディジアンタングル(類似)チャネルを構築する。
NEXP を捉えるためには、$| psi rangle = sqrta | sqrt1-a | psi_+ rangle という形の非負の振幅を持つのに十分であることを示す。
論文 参考訳(メタデータ) (2024-02-23T12:22:03Z) - Sample-Efficient Linear Regression with Self-Selection Bias [7.605563562103568]
未知のインデックス設定における自己選択バイアスを伴う線形回帰の問題を考察する。
我々は,$mathbfw_1,ldots,mathbfw_kinを復元する,新しい,ほぼ最適なサンプル効率($k$)アルゴリズムを提案する。
このアルゴリズムは雑音の仮定をかなり緩めることに成功し、従って関連する最大線形回帰の設定にも成功している。
論文 参考訳(メタデータ) (2024-02-22T02:20:24Z) - Provably learning a multi-head attention layer [55.2904547651831]
マルチヘッドアテンション層は、従来のフィードフォワードモデルとは分離したトランスフォーマーアーキテクチャの重要な構成要素の1つである。
本研究では,ランダムな例から多面的注意層を実証的に学習する研究を開始する。
最悪の場合、$m$に対する指数的依存は避けられないことを示す。
論文 参考訳(メタデータ) (2024-02-06T15:39:09Z) - Randomized and Deterministic Attention Sparsification Algorithms for
Over-parameterized Feature Dimension [18.57735939471469]
我々は注意問題のスパシフィケーションを考慮する。
超大規模特徴量の場合、文の長さをほぼ線形に縮めることができる。
論文 参考訳(メタデータ) (2023-04-10T05:52:38Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - On the speed of uniform convergence in Mercer's theorem [6.028247638616059]
コンパクト集合上の連続正定核 $K(mathbf x, mathbf y)$ は $sum_i=1infty lambda_iphi_i(mathbf x)phi_i(mathbf y)$ と表すことができ、$(lambda_i,phi_i)$ は対応する積分作用素の固有値-固有ベクトル対である。
固有値の減衰速度からこの収束速度を推定し、300万ドルで証明する。
論文 参考訳(メタデータ) (2022-05-01T15:07:57Z) - The EM Algorithm is Adaptively-Optimal for Unbalanced Symmetric Gaussian
Mixtures [36.91281862322494]
EMアルゴリズムは、$tildeOBig(minBigfrac1(1-2delta_*)sqrtfracdn,frac1|theta_*|sqrtfracdn,left(fracdnright)1/4BigBig)$を$OBig(frac1|theta_*|2Big以下で適応的に達成することを示した。
論文 参考訳(メタデータ) (2021-03-29T14:28:17Z) - Optimal Mean Estimation without a Variance [103.26777953032537]
本研究では,データ生成分布の分散が存在しない環境での重み付き平均推定問題について検討する。
最小の信頼区間を$n,d,delta$の関数として得る推定器を設計する。
論文 参考訳(メタデータ) (2020-11-24T22:39:21Z) - Efficient Statistics for Sparse Graphical Models from Truncated Samples [19.205541380535397]
i) スパースガウス図形モデルの推論と (ii) スパース線形モデルの回復支援の2つの基本的問題と古典的問題に焦点をあてる。
疎線型回帰については、$(bf x,y)$ が生成されるが、$y = bf xtopOmega* + MathcalN(0,1)$ と $(bf x, y)$ は、truncation set $S subseteq mathbbRd$ に属する場合にのみ見られる。
論文 参考訳(メタデータ) (2020-06-17T09:21:00Z) - On the Complexity of Minimizing Convex Finite Sums Without Using the
Indices of the Individual Functions [62.01594253618911]
有限和の有限ノイズ構造を利用して、大域オラクルモデルの下での一致する$O(n2)$-upper境界を導出する。
同様のアプローチを踏襲したSVRGの新規な適応法を提案し、これはオラクルと互換性があり、$tildeO(n2+nsqrtL/mu)log (1/epsilon)$と$O(nsqrtL/epsilon)$, for $mu>0$と$mu=0$の複雑さ境界を実現する。
論文 参考訳(メタデータ) (2020-02-09T03:39:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。