論文の概要: Data Structures for Density Estimation
- arxiv url: http://arxiv.org/abs/2306.11312v1
- Date: Tue, 20 Jun 2023 06:13:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 15:32:51.389692
- Title: Data Structures for Density Estimation
- Title(参考訳): 密度推定のためのデータ構造
- Authors: Anders Aamand, Alexandr Andoni, Justin Y. Chen, Piotr Indyk, Shyam
Narayanan, Sandeep Silwal
- Abstract要約: p$のサブリニア数($n$)が与えられた場合、主な結果は$k$のサブリニアで$v_i$を識別する最初のデータ構造になります。
また、Acharyaなどのアルゴリズムの改良版も提供します。
- 参考スコア(独自算出の注目度): 66.36971978162461
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study statistical/computational tradeoffs for the following density
estimation problem: given $k$ distributions $v_1, \ldots, v_k$ over a discrete
domain of size $n$, and sampling access to a distribution $p$, identify $v_i$
that is "close" to $p$. Our main result is the first data structure that, given
a sublinear (in $n$) number of samples from $p$, identifies $v_i$ in time
sublinear in $k$. We also give an improved version of the algorithm of Acharya
et al. (2018) that reports $v_i$ in time linear in $k$. The experimental
evaluation of the latter algorithm shows that it achieves a significant
reduction in the number of operations needed to achieve a given accuracy
compared to prior work.
- Abstract(参考訳): 我々は,次の密度推定問題に対する統計的/計算的トレードオフについて検討する。 $k$ 分布 $v_1, \ldots, v_k$ が離散的領域で与えられると,$n$ が与えられ,分布へのアクセスをサンプリングする$p$ が与えられ,$p$ に「近い」$v_i$ が識別される。
主な結果は、最初のデータ構造で、$p$からのサンプルのサブリニア(n$)数が与えられたとき、$k$で$v_i$を識別します。
また、Acharya et al. (2018) のアルゴリズムの改良版も提供します。
後者のアルゴリズムの実験的評価は、与えられた精度を達成するのに必要な演算数を以前の作業と比較して大幅に減少させることを示した。
関連論文リスト
- Statistical-Computational Trade-offs for Density Estimation [60.81548752871115]
幅広い種類のデータ構造に対して、それらの境界は著しく改善されないことを示す。
これは密度推定のための新しい統計計算トレードオフである。
論文 参考訳(メタデータ) (2024-10-30T15:03:33Z) - Online Robust Mean Estimation [37.746091744197656]
オンライン環境における高次元ロバスト平均推定問題について検討する。
このモデルでは、オンラインロバスト平均推定の主な2つの結果が証明されている。
論文 参考訳(メタデータ) (2023-10-24T15:28:43Z) - PLAN: Variance-Aware Private Mean Estimation [12.452663855242344]
差分的にプライベートな平均推定は、データ分析と機械学習のためのプライバシ保護アルゴリズムの重要な構成要素である。
ベクトル $boldsymbolsigma$ のスキューを利用する方法を示し、$ell$エラーで(ゼロ桁の)微分プライベート平均推定値を得る。
PLANの有効性を検証するため,合成データと実世界のデータの両方で精度を実証的に評価した。
論文 参考訳(メタデータ) (2023-06-14T21:04:50Z) - Improved Learning-augmented Algorithms for k-means and k-medians
Clustering [8.04779839951237]
学習強化設定におけるクラスタリングの問題について考察し、そこでは、$d$次元ユークリッド空間のデータセットが与えられる。
本稿では,クラスタリングコストを改良したセンターを生成する決定論的$k$-meansアルゴリズムを提案する。
我々のアルゴリズムは、予測があまり正確でないときでも機能する。つまり、我々の限界は$alpha$を$/2$に保ち、以前の研究で$alpha$よりも1/7$に改善する。
論文 参考訳(メタデータ) (2022-10-31T03:00:11Z) - TURF: A Two-factor, Universal, Robust, Fast Distribution Learning
Algorithm [64.13217062232874]
最も強力で成功したモダリティの1つは、全ての分布を$ell$距離に近似し、基本的に最も近い$t$-piece次数-$d_$の少なくとも1倍大きい。
本稿では,この数値をほぼ最適に推定する手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T03:49:28Z) - Clustering Mixture Models in Almost-Linear Time via List-Decodable Mean
Estimation [58.24280149662003]
本稿では,データセットの大部分を敵が破壊できるリストデコタブル平均推定の問題について検討する。
我々は、ほぼ最適な統計的保証を達成するために、リストデコダブル平均推定のための新しいアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-16T03:34:14Z) - List-Decodable Mean Estimation in Nearly-PCA Time [50.79691056481693]
高次元におけるリストデコタブル平均推定の基本的な課題について検討する。
我々のアルゴリズムは、すべての$k = O(sqrtd) cup Omega(d)$に対して$widetildeO(ndk)$で実行されます。
我々のアルゴリズムの変種は、すべての$k$に対してランタイム$widetildeO(ndk)$を持ち、リカバリ保証の$O(sqrtlog k)$ Factorを犠牲にしている。
論文 参考訳(メタデータ) (2020-11-19T17:21:37Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。