論文の概要: On the Role of Channel Capacity in Learning Gaussian Mixture Models
- arxiv url: http://arxiv.org/abs/2202.07707v1
- Date: Tue, 15 Feb 2022 20:15:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 14:59:16.288897
- Title: On the Role of Channel Capacity in Learning Gaussian Mixture Models
- Title(参考訳): ガウス混合モデルの学習におけるチャネル容量の役割について
- Authors: Elad Romanov, Tamir Bendory, Or Ordentlich
- Abstract要約: 平衡ガウス混合モデル(GMM)の未知中心を学習する際のサンプル複雑性について検討する。
- 参考スコア(独自算出の注目度): 31.841289319809814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies the sample complexity of learning the $k$ unknown centers
of a balanced Gaussian mixture model (GMM) in $\mathbb{R}^d$ with spherical
covariance matrix $\sigma^2\mathbf{I}$. In particular, we are interested in the
following question: what is the maximal noise level $\sigma^2$, for which the
sample complexity is essentially the same as when estimating the centers from
labeled measurements? To that end, we restrict attention to a Bayesian
formulation of the problem, where the centers are uniformly distributed on the
sphere $\sqrt{d}\mathcal{S}^{d-1}$. Our main results characterize the exact
noise threshold $\sigma^2$ below which the GMM learning problem, in the large
system limit $d,k\to\infty$, is as easy as learning from labeled observations,
and above which it is substantially harder. The threshold occurs at $\frac{\log
k}{d} = \frac12\log\left( 1+\frac{1}{\sigma^2} \right)$, which is the capacity
of the additive white Gaussian noise (AWGN) channel. Thinking of the set of $k$
centers as a code, this noise threshold can be interpreted as the largest noise
level for which the error probability of the code over the AWGN channel is
small. Previous works on the GMM learning problem have identified the minimum
distance between the centers as a key parameter in determining the statistical
difficulty of learning the corresponding GMM. While our results are only proved
for GMMs whose centers are uniformly distributed over the sphere, they hint
that perhaps it is the decoding error probability associated with the center
constellation as a channel code that determines the statistical difficulty of
learning the corresponding GMM, rather than just the minimum distance.
- Abstract(参考訳): 本稿では, 球面共分散行列 $\sigma^2\mathbf{i}$ を持つ$\mathbb{r}^d$ における平衡ガウス混合モデル (gmm) のk$未知中心を学習するサンプル複雑性について検討する。
特に、以下の質問に興味を持っている: ラベル付き測定値から中心を推定する際に、サンプルの複雑さが本質的に同じである最大ノイズレベル$\sigma^2$ とは何でしょうか?
そのために、この問題のベイズ的定式化に注意を向け、そこで中心は球面 $\sqrt{d}\mathcal{S}^{d-1}$ 上で均一に分布する。
閾値は$\frac{\log k}{d} = \frac12\log\left(1+\frac{1}{\sigma^2} \right)$で、これは付加的な白色ガウスノイズ(AWGN)チャネルの容量である。
コードとしての$k$ Centerのセットを考えると、このノイズ閾値は、AWGNチャネル上のコードのエラー確率が小さい最大のノイズレベルと解釈できる。
本研究の結果は, 球面上に一様分布するGMMに対してのみ証明されるが, 最小距離ではなく, 対応するGMMを学習することの統計的困難さを判断するチャネル符号として, 中心星座に付随する復号誤差確率が示唆される。
