論文の概要: Efficient Statistics With Unknown Truncation, Polynomial Time Algorithms, Beyond Gaussians
- arxiv url: http://arxiv.org/abs/2410.01656v1
- Date: Wed, 2 Oct 2024 15:21:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 16:13:24.584849
- Title: Efficient Statistics With Unknown Truncation, Polynomial Time Algorithms, Beyond Gaussians
- Title(参考訳): 未知のトリニケート、多項式時間アルゴリズムを用いた効率的な統計学 : ガウシアンを超えて
- Authors: Jane H. Lee, Anay Mehrotra, Manolis Zampetakis,
- Abstract要約: 本研究では,サンプルが未知の集合に落下した場合にのみ,分布パラメータの推定を行う。
- 参考スコア(独自算出の注目度): 7.04316974339151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the estimation of distributional parameters when samples are shown only if they fall in some unknown set $S \subseteq \mathbb{R}^d$. Kontonis, Tzamos, and Zampetakis (FOCS'19) gave a $d^{\mathrm{poly}(1/\varepsilon)}$ time algorithm for finding $\varepsilon$-accurate parameters for the special case of Gaussian distributions with diagonal covariance matrix. Recently, Diakonikolas, Kane, Pittas, and Zarifis (COLT'24) showed that this exponential dependence on $1/\varepsilon$ is necessary even when $S$ belongs to some well-behaved classes. These works leave the following open problems which we address in this work: Can we estimate the parameters of any Gaussian or even extend beyond Gaussians? Can we design $\mathrm{poly}(d/\varepsilon)$ time algorithms when $S$ is a simple set such as a halfspace? We make progress on both of these questions by providing the following results: 1. Toward the first question, we give a $d^{\mathrm{poly}(\ell/\varepsilon)}$ time algorithm for any exponential family that satisfies some structural assumptions and any unknown set $S$ that is $\varepsilon$-approximable by degree-$\ell$ polynomials. This result has two important applications: 1a) The first algorithm for estimating arbitrary Gaussian distributions from samples truncated to an unknown $S$; and 1b) The first algorithm for linear regression with unknown truncation and Gaussian features. 2. To address the second question, we provide an algorithm with runtime $\mathrm{poly}(d/\varepsilon)$ that works for a set of exponential families (containing all Gaussians) when $S$ is a halfspace or an axis-aligned rectangle. Along the way, we develop tools that may be of independent interest, including, a reduction from PAC learning with positive and unlabeled samples to PAC learning with positive and negative samples that is robust to certain covariate shifts.
- Abstract(参考訳): サンプルが未知の集合 $S \subseteq \mathbb{R}^d$ に該当する場合にのみ、分布パラメータを推定する。
Kontonis, Tzamos, and Zampetakis (FOCS'19) は、対角共分散行列を持つガウス分布の特別な場合の$\varepsilon$-正確なパラメータを見つけるための$d^{\mathrm{poly}(1/\varepsilon)} の時間アルゴリズムを与えた。
最近、Diakonikolas, Kane, Pittas, Zarifis (COLT'24) は、1/\varepsilon$ に対する指数関数的依存は、S$ がいくつかのよく定義されたクラスに属する場合でも必要であることを示した。
これらの研究は、我々がこの研究で取り組んだ以下のオープンな問題を残している: ガウスのパラメータを推定できるか、あるいはガウスを超えて拡張できるのか?
最初の質問に向けて、いくつかの構造的仮定を満たす指数族に対して$d^{\mathrm{poly}(\ell/\varepsilon)}$時間アルゴリズムを与え、未知の集合として$S$を$\varepsilon$-approximable by degree-$\ell$ polynomials を与える。
この結果には2つの重要な応用がある: 1a) 未知の$S$にtruncatedされたサンプルから任意のガウス分布を推定する最初のアルゴリズム、1b) 未知のトランケーションとガウス特徴を持つ線形回帰のための最初のアルゴリズム。
その過程で, 正・未ラベルのサンプルによるPAC学習から, 正・負のサンプルによるPAC学習へ, 特定の共変量シフトに対して頑健なツールを開発する。
