論文の概要: Dictionary Learning for the Almost-Linear Sparsity Regime
- arxiv url: http://arxiv.org/abs/2210.10855v2
- Date: Mon, 27 Mar 2023 21:28:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 19:38:21.205355
- Title: Dictionary Learning for the Almost-Linear Sparsity Regime
- Title(参考訳): ほぼ線形スパルシティーレジームのための辞書学習
- Authors: Alexei Novikov and Stephen White
- Abstract要約: 辞書学習は、信号処理やデータ科学における応用においてますます重要になっている。
SPORADIC (SPectral ORAcle DICtionary Learning) は、重み付けされた共分散行列の族に対する効率的なスペクトル法である。
高次元において、SPORADICはよく知られた制限等尺性(RIP)を満たす過剰完備(K > M$)辞書を復元できることを示す。
これらの精度保証は、未知のスパースベクトル $mathbfx_i$ の支持と符号が、高い確率で正確に復元され、任意に閉じることができるような「オラクル特性」を持つ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dictionary learning, the problem of recovering a sparsely used matrix
$\mathbf{D} \in \mathbb{R}^{M \times K}$ and $N$ $s$-sparse vectors
$\mathbf{x}_i \in \mathbb{R}^{K}$ from samples of the form $\mathbf{y}_i =
\mathbf{D}\mathbf{x}_i$, is of increasing importance to applications in signal
processing and data science. When the dictionary is known, recovery of
$\mathbf{x}_i$ is possible even for sparsity linear in dimension $M$, yet to
date, the only algorithms which provably succeed in the linear sparsity regime
are Riemannian trust-region methods, which are limited to orthogonal
dictionaries, and methods based on the sum-of-squares hierarchy, which requires
super-polynomial time in order to obtain an error which decays in $M$. In this
work, we introduce SPORADIC (SPectral ORAcle DICtionary Learning), an efficient
spectral method on family of reweighted covariance matrices. We prove that in
high enough dimensions, SPORADIC can recover overcomplete ($K > M$)
dictionaries satisfying the well-known restricted isometry property (RIP) even
when sparsity is linear in dimension up to logarithmic factors. Moreover, these
accuracy guarantees have an ``oracle property" that the support and signs of
the unknown sparse vectors $\mathbf{x}_i$ can be recovered exactly with high
probability, allowing for arbitrarily close estimation of $\mathbf{D}$ with
enough samples in polynomial time. To the author's knowledge, SPORADIC is the
first polynomial-time algorithm which provably enjoys such convergence
guarantees for overcomplete RIP matrices in the near-linear sparsity regime.
- Abstract(参考訳): 辞書学習 (Dictionary learning) は、スパース的に使われる行列 $\mathbf{D} \in \mathbb{R}^{M \times K}$ と $N$ $s$-sparse vectors $\mathbf{x}_i \in \mathbb{R}^{K}$ を、形式 $\mathbf{y}_i = \mathbf{D}\mathbf{x}_i$ のサンプルから回収する問題である。
本研究では,再重み付け共分散行列の族に対する効率的なスペクトル法であるsporadic (spectral oracle dictionary learning)を提案する。
高次元において、SPORADICは、空間が対数因子まで線形である場合でも、よく知られた制限等尺性(RIP)を満たす過剰完備(K > M$)辞書を復元できることを示す。
さらに、これらの精度保証は、未知のスパースベクトル $\mathbf{x}_i$ の支持と符号を高い確率で正確に復元することができ、多項式時間で十分なサンプルで$\mathbf{D}$を任意に近似することができる ``oracle property' を持つ。
著者の知る限り、SPORADIC は多項式時間アルゴリズムとしては初めてのもので、ニア線形空間の過完全 RIP 行列に対する収束保証を確実に享受する。
