論文の概要: Efficient Statistics for Sparse Graphical Models from Truncated Samples
- arxiv url: http://arxiv.org/abs/2006.09735v1
- Date: Wed, 17 Jun 2020 09:21:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 20:45:53.964710
- Title: Efficient Statistics for Sparse Graphical Models from Truncated Samples
- Title(参考訳): 切り抜きサンプルからのスパースグラフモデルの効率的な統計
- Authors: Arnab Bhattacharyya and Rathin Desai and Sai Ganesh Nagarajan and
Ioannis Panageas
- Abstract要約: i) スパースガウス図形モデルの推論と (ii) スパース線形モデルの回復支援の2つの基本的問題と古典的問題に焦点をあてる。
疎線型回帰については、$(bf x,y)$ が生成されるが、$y = bf xtopOmega* + MathcalN(0,1)$ と $(bf x, y)$ は、truncation set $S subseteq mathbbRd$ に属する場合にのみ見られる。
- 参考スコア(独自算出の注目度): 19.205541380535397
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study high-dimensional estimation from truncated samples.
We focus on two fundamental and classical problems: (i) inference of sparse
Gaussian graphical models and (ii) support recovery of sparse linear models.
(i) For Gaussian graphical models, suppose $d$-dimensional samples ${\bf x}$
are generated from a Gaussian $N(\mu,\Sigma)$ and observed only if they belong
to a subset $S \subseteq \mathbb{R}^d$. We show that ${\mu}$ and ${\Sigma}$ can
be estimated with error $\epsilon$ in the Frobenius norm, using
$\tilde{O}\left(\frac{\textrm{nz}({\Sigma}^{-1})}{\epsilon^2}\right)$ samples
from a truncated $\mathcal{N}({\mu},{\Sigma})$ and having access to a
membership oracle for $S$. The set $S$ is assumed to have non-trivial measure
under the unknown distribution but is otherwise arbitrary.
(ii) For sparse linear regression, suppose samples $({\bf x},y)$ are
generated where $y = {\bf x}^\top{{\Omega}^*} + \mathcal{N}(0,1)$ and $({\bf
x}, y)$ is seen only if $y$ belongs to a truncation set $S \subseteq
\mathbb{R}$. We consider the case that ${\Omega}^*$ is sparse with a support
set of size $k$. Our main result is to establish precise conditions on the
problem dimension $d$, the support size $k$, the number of observations $n$,
and properties of the samples and the truncation that are sufficient to recover
the support of ${\Omega}^*$. Specifically, we show that under some mild
assumptions, only $O(k^2 \log d)$ samples are needed to estimate ${\Omega}^*$
in the $\ell_\infty$-norm up to a bounded error.
For both problems, our estimator minimizes the sum of the finite population
negative log-likelihood function and an $\ell_1$-regularization term.
- Abstract(参考訳): 本稿では,切断試料からの高次元推定について検討する。
(i) ガウスのグラフィカルモデルに対して、$d$-次元のサンプル${\bf x}$ がガウスの$n(\mu,\sigma)$ から生成され、それらが$s \subseteq \mathbb{r}^d$ に属する場合にのみ観測されるとする。
集合 $s$ は未知分布の下で非自明な測度であると仮定されるが、それ以外は任意である。
(ii) スパース線型回帰に対しては、$({\bf x},y)$ が生成されるが、$y = {\bf x}^\top{{\Omega}^*} + \mathcal{N}(0,1)$ と $({\bf x}, y)$ は、$y$ が truncation set $S \subseteq \mathbb{R}$ に属する場合にのみ見られる。
我々は、${\omega}^*$ が sparse で、サポートセットのサイズが $k$ である場合を考える。
我々の主な成果は, 問題次元$d$, サポートサイズ$k$, 観測値$n$, および, サンプルの特性, および${\Omega}^*$の支持を回復するのに十分なトラニケーションについて, 正確な条件を確立することである。
特に、いくつかの穏やかな仮定の下では、境界付きエラーまで$\ell_\infty$-normで${\omega}^*$を見積もるためには、サンプルは$o(k^2 \log d)$だけである。
- Dimension-free Private Mean Estimation for Anisotropic Distributions [55.86374912608193]
論文 参考訳(メタデータ) (2024-11-01T17:59:53Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - Learning linear dynamical systems under convex constraints [4.4351901934764975]
論文 参考訳(メタデータ) (2023-03-27T11:49:40Z) - Statistically Optimal Robust Mean and Covariance Estimation for
Anisotropic Gaussians [3.5788754401889014]
我々は、少なくとも1-デルタの確率で満足するコフラ行列 $Sigma の推定器 $widehat Sigma を構築する。
論文 参考訳(メタデータ) (2023-01-21T23:28:55Z) - Structure Learning in Graphical Models from Indirect Observations [17.521712510832558]
論文 参考訳(メタデータ) (2022-05-06T19:24:44Z) - Random matrices in service of ML footprint: ternary random features with
no performance loss [55.30329197651178]
我々は、$bf K$ の固有スペクトルが$bf w$ の i.d. 成分の分布とは独立であることを示す。
論文 参考訳(メタデータ) (2021-10-05T09:33:49Z) - Nonasymptotic one-and two-sample tests in high dimension with unknown
covariance structure [0.0]
テストの問題は、$mu が 0 に対して $eta-閉である場合、すなわち $|mu| geq (eta + delta)$ に対して $|mu| leq eta である。
論文 参考訳(メタデータ) (2021-09-01T06:22:53Z) - Self-training Converts Weak Learners to Strong Learners in Mixture
Models [86.7137362125503]
擬似ラベルの $boldsymbolbeta_mathrmpl$ が,最大$C_mathrmerr$ の分類誤差を達成可能であることを示す。
さらに、ロジスティックな損失に対して勾配降下を実行することで、ラベル付き例のみを使用して、分類誤差が$C_mathrmerr$で擬ラベルの $boldsymbolbeta_mathrmpl$ が得られることを示す。
論文 参考訳(メタデータ) (2021-06-25T17:59:16Z) - Sparse sketches with small inversion bias [79.77110958547695]
本研究では、確率行列に対する$(epsilon,delta)$-unbiased estimatorという概念に基づいて、逆バイアスを解析するためのフレームワークを開発する。
スケッチ行列 $S$ が密度が高く、すなわちサブガウスのエントリを持つとき、$(epsilon,delta)$-unbiased for $(Atop A)-1$ は $m=O(d+sqrt d/ のスケッチを持つ。
論文 参考訳(メタデータ) (2020-11-21T01:33:15Z) - Near-Optimal SQ Lower Bounds for Agnostically Learning Halfspaces and
ReLUs under Gaussian Marginals [49.60752558064027]
論文 参考訳(メタデータ) (2020-06-29T17:10:10Z) - Robust Gaussian Covariance Estimation in Nearly-Matrix Multiplication
Time [14.990725929840892]
ここでは、$T(N, d)$は、その変換によって$d倍のN$行列を乗算するのに要する時間である。
論文 参考訳(メタデータ) (2020-06-23T20:21:27Z)