論文の概要: Tree density estimation
- arxiv url: http://arxiv.org/abs/2111.11971v1
- Date: Tue, 23 Nov 2021 16:05:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-24 18:05:26.669016
- Title: Tree density estimation
- Title(参考訳): 樹木密度の推定
- Authors: L\'aszl\'o Gy\"orfi and Aryeh Kontorovich and Roi Weiss
- Abstract要約: 確率密度 $f(boldsymbol x)$ を持つランダムベクトル $boldsymbol X$ in $mathbb Rd$ の密度推定。
有界なサポートを持つリプシッツ連続 $f$ に対して、$mathbb E int |f_n(boldsymbol x)-fT*(boldsymbol x)|dboldsymbol x=0$ a.s である。
有界なサポートを持つリプシッツ連続$f$に対して、$mathbb E int |f_n(boldsymbol x)-f
- 参考スコア(独自算出の注目度): 12.831051269764115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of density estimation for a random vector ${\boldsymbol
X}$ in $\mathbb R^d$ with probability density $f(\boldsymbol x)$. For a
spanning tree $T$ defined on the vertex set $\{1,\dots ,d\}$, the tree density
$f_{T}$ is a product of bivariate conditional densities. The optimal spanning
tree $T^*$ is the spanning tree $T$, for which the Kullback-Leibler divergence
of $f$ and $f_{T}$ is the smallest. From i.i.d. data we identify the optimal
tree $T^*$ and computationally efficiently construct a tree density estimate
$f_n$ such that, without any regularity conditions on the density $f$, one has
that $\lim_{n\to \infty} \int |f_n(\boldsymbol x)-f_{T^*}(\boldsymbol
x)|d\boldsymbol x=0$ a.s. For Lipschitz continuous $f$ with bounded support,
$\mathbb E\{ \int |f_n(\boldsymbol x)-f_{T^*}(\boldsymbol x)|d\boldsymbol
- Abstract(参考訳): 確率密度 $f(\boldsymbol x)$ を持つランダムベクトル ${\boldsymbol X}$ in $\mathbb R^d$ に対する密度推定の問題を研究する。
頂点集合 $\{1,\dots ,d\}$ 上で定義されるスパンディングツリー $t$ に対して、ツリー密度 $f_{t}$ は二変数条件密度の積である。
最適なスパンニングツリー $T^*$ はスパンニングツリー $T$ であり、Kulback-Leibler の発散は $f$ と $f_{T}$ が最小である。
d.d.データから最適木 $T^*$ を同定し、密度 $f$ 上の正規性条件がなければ、$\lim_{n\to \infty} \int |f_n(\boldsymbol x)-f_{T^*}(\boldsymbol x)|d\boldsymbol x=0$ a.s. for Lipschitz continuous $f$ with bounded support, $\mathbb E\{ \int |f_n(\boldsymbol x)-f_{T^*}(\boldsymbol x)|d\boldsymbol x\}=O(n^{4}/$)が成り立つような木密度推定$f_n$ を計算的に構成する。
- PREM: Privately Answering Statistical Queries with Relative Error [91.98332694700046]
合成データを生成する新しいフレームワークである$mathsfPREM$(Private Relative Error Multiplicative weight update)を紹介します。
論文 参考訳(メタデータ) (2025-02-20T18:32:02Z) - A note on estimating the dimension from a random geometric graph [2.3020018305241337]
また、密度の条件がなければ、$d$の一貫した推定子は$n r_nd to infty$と$r_n = o(1)$が存在することを示す。
論文 参考訳(メタデータ) (2023-11-21T23:46:44Z) - A spectral least-squares-type method for heavy-tailed corrupted
regression with unknown covariance \& heterogeneous noise [2.019622939313173]
重み付き最小二乗線形回帰は、少なくとも$epsilon n$ arbitrary outliersの$n$のラベル特徴サンプルを破損させたと仮定して再検討する。
本稿では,$(Sigma,Xi) や $Xi$ の演算ノルムに関する知識を前提に,電力法に基づくほぼ最適に計算可能な推定器を提案する。
論文 参考訳(メタデータ) (2022-09-06T23:37:31Z) - Near-optimal fitting of ellipsoids to random points [68.12685213894112]
我々はこの予想を、ある$n = Omega(, d2/mathrmpolylog(d))$ に対する適合楕円体を構成することで対数的因子まで解決する。
論文 参考訳(メタデータ) (2022-08-19T18:00:34Z) - Low-Rank Approximation with $1/\epsilon^{1/3}$ Matrix-Vector Products [58.05771390012827]
我々の主な成果は、$tildeO(k/sqrtepsilon)$ matrix-vector productのみを使用するアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-10T16:10:41Z) - Coresets for Decision Trees of Signals [19.537354146654845]
これは、決定木と -- 機械学習から -- 計算幾何学における分割木の間のリンクをフォージすることで実現している。
論文 参考訳(メタデータ) (2021-10-07T05:49:55Z) - Self-training Converts Weak Learners to Strong Learners in Mixture
Models [86.7137362125503]
擬似ラベルの $boldsymbolbeta_mathrmpl$ が,最大$C_mathrmerr$ の分類誤差を達成可能であることを示す。
さらに、ロジスティックな損失に対して勾配降下を実行することで、ラベル付き例のみを使用して、分類誤差が$C_mathrmerr$で擬ラベルの $boldsymbolbeta_mathrmpl$ が得られることを示す。
論文 参考訳(メタデータ) (2021-06-25T17:59:16Z) - Near-Optimal Learning of Tree-Structured Distributions by Chow-Liu [14.298220510927695]
古典的ChowLiuアルゴリズム(IEEE Trans.Inform.Theory, 1968)に対する有限サンプル保証を提供する。
特定の木の$T$に対して、$widetildeO (|Sigma|2nvarepsilon-1)$の分布からのサンプルを$P$ over $Sigman$とすると、最も近いKL分岐を効率的に学習できる。
論文 参考訳(メタデータ) (2020-11-09T02:08:56Z) - An Optimal Separation of Randomized and Quantum Query Complexity [67.19751155411075]
すべての決定木に対して、与えられた順序 $ellsqrtbinomdell (1+log n)ell-1,$ sum to at least $cellsqrtbinomdell (1+log n)ell-1,$ where $n$ is the number of variables, $d$ is the tree depth, $c>0$ is a absolute constant。
論文 参考訳(メタデータ) (2020-08-24T06:50:57Z) - Optimal Combination of Linear and Spectral Estimators for Generalized
Linear Models [59.015960528781115]
最適に $hatboldsymbol xrm L$ と $hatboldsymbol xrm s$ を組み合わせる方法を示す。
我々は,$(boldsymbol x, hatboldsymbol xrm L, hatboldsymbol xrm s)$の制限分布を確立するために,Adroximate Message Passing (AMP)アルゴリズムの設計と解析を行う。
論文 参考訳(メタデータ) (2020-08-07T18:20:05Z) - Optimal Coreset for Gaussian Kernel Density Estimation [0.8376091455761259]
点集合 $Psubset mathbbRd$ が与えられたとき、$P$ の核密度推定は [ overlinemathcalG_P(x) = frac1left|Pright|sum_pin Pe-leftlVert x-p rightrVert2 ] for any $xinmathbbRd$ と定義される。
我々は、小さなサブセット$Q$ of $P を構築する方法を研究する。
論文 参考訳(メタデータ) (2020-07-15T22:58:50Z)