論文の概要: Memory Efficient And Minimax Distribution Estimation Under Wasserstein
Distance Using Bayesian Histograms
- arxiv url: http://arxiv.org/abs/2307.10099v1
- Date: Wed, 19 Jul 2023 16:13:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-20 13:18:55.217847
- Title: Memory Efficient And Minimax Distribution Estimation Under Wasserstein
Distance Using Bayesian Histograms
- Title(参考訳): ベイズヒストグラムを用いたwasserstein距離下でのメモリ効率とミニマックス分布推定
- Authors: Peter Matthew Jacobs, Lekha Patel, Anirban Bhattacharya, Debdeep Pati
- Abstract要約: 例えば、$d 2v$の場合、ヒストグラムは特別なテキストメモリ効率特性を持ち、サンプルサイズが$nであるのに対して、$nd/2v$ binsはミニマックスレートの最適性を得るために必要であることを示す。
達成されたメモリフットプリントは、既存のミニマックス最適手順を$n$の係数で克服する。例えば、ボレル確率測度クラスのミニマックス推定器である経験的測度と比較した場合、フットプリントを$n1 - d/2v$に削減する。
- 参考スコア(独自算出の注目度): 6.21295508577576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study Bayesian histograms for distribution estimation on $[0,1]^d$ under
the Wasserstein $W_v, 1 \leq v < \infty$ distance in the i.i.d sampling regime.
We newly show that when $d < 2v$, histograms possess a special \textit{memory
efficiency} property, whereby in reference to the sample size $n$, order
$n^{d/2v}$ bins are needed to obtain minimax rate optimality. This result holds
for the posterior mean histogram and with respect to posterior contraction:
under the class of Borel probability measures and some classes of smooth
densities. The attained memory footprint overcomes existing minimax optimal
procedures by a polynomial factor in $n$; for example an $n^{1 - d/2v}$ factor
reduction in the footprint when compared to the empirical measure, a minimax
estimator in the Borel probability measure class. Additionally constructing
both the posterior mean histogram and the posterior itself can be done
super--linearly in $n$. Due to the popularity of the $W_1,W_2$ metrics and the
coverage provided by the $d < 2v$ case, our results are of most practical
interest in the $(d=1,v =1,2), (d=2,v=2), (d=3,v=2)$ settings and we provide
simulations demonstrating the theory in several of these instances.
- Abstract(参考訳): 本研究では,wasserstein $w_v, 1 \leq v < \infty$ distance における[0,1]^d$ の分布推定のためのベイズヒストグラムについて検討した。
新たに、$d < 2v$ の場合、ヒストグラムは特別な \textit{Memory efficiency} 特性を持ち、サンプルサイズ $n$ を参照して、$n^{d/2v}$ bins がミニマックスレート最適性を得るために必要であることを示す。
この結果は、後方平均ヒストグラムおよび後方収縮に関して、ボレル確率測度のクラスといくつかの滑らかな密度のクラスの下に成立する。
達成されたメモリフットプリントは、既存のminimax最適手順をn$の多項式係数で克服する。例えば、ボレル確率測度クラスのminimax推定器である経験的測度と比較した場合、フットプリントの$n^{1 - d/2v}$因子減少である。
さらに、後方の平均ヒストグラムと後方ヒストグラムの両方を構築することは、n$で超線形に行うことができる。
w_1,w_2$ メトリクスの人気と $d < 2v$ ケースによるカバレッジのため、結果は $(d=1,v =1,2), (d=2,v=2), (d=3,v=2)$ の設定に最も実用的に興味を持ち、これらのいくつかの例で理論を実証するシミュレーションを提供する。
関連論文リスト
- Active Subsampling for Measurement-Constrained M-Estimation of Individualized Thresholds with High-Dimensional Data [3.1138411427556445]
測定制約のある問題では、大きなデータセットが利用可能であるにもかかわらず、大きなデータセットのごく一部でラベルを観測するのに手頃な価格にしかならない。
このことは、どのデータポイントが予算制約のあるラベルに最も有益であるかという重要な疑問を引き起こします。
本稿では,測定制約付きM推定フレームワークにおける最適個別化しきい値の推定に焦点をあてる。
論文 参考訳(メタデータ) (2024-11-21T00:21:17Z) - Optimal Sketching for Residual Error Estimation for Matrix and Vector Norms [50.15964512954274]
線形スケッチを用いた行列とベクトルノルムの残差誤差推定問題について検討する。
これは、前作とほぼ同じスケッチサイズと精度で、経験的にかなり有利であることを示す。
また、スパースリカバリ問題に対して$Omega(k2/pn1-2/p)$低いバウンダリを示し、これは$mathrmpoly(log n)$ factorまで厳密である。
論文 参考訳(メタデータ) (2024-08-16T02:33:07Z) - Multiple-policy Evaluation via Density Estimation [30.914344538340412]
本稿では,この問題に対して$mathrmCAESAR$というアルゴリズムを提案する。
低次かつ対数的な$mathrmCAESAR$は、$tildeOleft(fracH4epsilon2sum_h=1Hmax_kin[K]sum_s,afrac(d_hpik(s,a))2mu*_h(s,a)right)$である。
論文 参考訳(メタデータ) (2024-03-29T23:55:25Z) - Minimax Optimality of Score-based Diffusion Models: Beyond the Density Lower Bound Assumptions [11.222970035173372]
カーネルベースのスコア推定器は$widetildeOleft(n-1 t-fracd+22(tfracd2 vee 1)rightの最適平均二乗誤差を達成する
核を用いたスコア推定器は,拡散モデルで生成した試料の分布の総変動誤差に対して,極小ガウスの下での最大平均2乗誤差を$widetildeOleft(n-1/2 t-fracd4right)$上界で達成することを示す。
論文 参考訳(メタデータ) (2024-02-23T20:51:31Z) - $L^1$ Estimation: On the Optimality of Linear Estimators [64.76492306585168]
この研究は、条件中央値の線型性を誘導する$X$上の唯一の先行分布がガウス分布であることを示している。
特に、条件分布 $P_X|Y=y$ がすべての$y$に対して対称であるなら、$X$ はガウス分布に従う必要がある。
論文 参考訳(メタデータ) (2023-09-17T01:45:13Z) - Data Structures for Density Estimation [66.36971978162461]
p$のサブリニア数($n$)が与えられた場合、主な結果は$k$のサブリニアで$v_i$を識別する最初のデータ構造になります。
また、Acharyaなどのアルゴリズムの改良版も提供します。
論文 参考訳(メタデータ) (2023-06-20T06:13:56Z) - Robust Sparse Mean Estimation via Incremental Learning [15.536082641659423]
そこで本研究では, 部分的に破損したサンプルの集合から, k$-sparse平均を推定することを目的とする, 頑健な平均推定問題について検討する。
両課題を適度な条件下で克服する簡易平均推定器を提案する。
私たちのメソッドは、スパーシティレベル$k$に関する事前の知識を必要としない。
論文 参考訳(メタデータ) (2023-05-24T16:02:28Z) - Estimating the minimizer and the minimum value of a regression function
under passive design [72.85024381807466]
最小値 $boldsymbolx*$ と最小値 $f*$ を滑らかで凸な回帰関数 $f$ で推定する新しい手法を提案する。
2次リスクと$boldsymbolz_n$の最適化誤差、および$f*$を推定するリスクについて、漸近的でない上界を導出する。
論文 参考訳(メタデータ) (2022-11-29T18:38:40Z) - TURF: A Two-factor, Universal, Robust, Fast Distribution Learning
Algorithm [64.13217062232874]
最も強力で成功したモダリティの1つは、全ての分布を$ell$距離に近似し、基本的に最も近い$t$-piece次数-$d_$の少なくとも1倍大きい。
本稿では,この数値をほぼ最適に推定する手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T03:49:28Z) - Likelihood estimation of sparse topic distributions in topic models and
its applications to Wasserstein document distance calculations [3.679981089267181]
トピックモデルでは、$ptimes n$予測ワード頻度行列は$ptimes K$ワードトピック行列$A$として分解される。
A$の列は、すべてのドキュメントに共通する$p$の混合コンポーネントと見なされる。
A$が未知の場合、プラグインに対応する可能性関数を最適化して$T$を見積もる。
論文 参考訳(メタデータ) (2021-07-12T22:22:32Z) - Sparse sketches with small inversion bias [79.77110958547695]
逆バイアスは、逆の共分散に依存する量の推定を平均化するときに生じる。
本研究では、確率行列に対する$(epsilon,delta)$-unbiased estimatorという概念に基づいて、逆バイアスを解析するためのフレームワークを開発する。
スケッチ行列 $S$ が密度が高く、すなわちサブガウスのエントリを持つとき、$(epsilon,delta)$-unbiased for $(Atop A)-1$ は $m=O(d+sqrt d/ のスケッチを持つ。
論文 参考訳(メタデータ) (2020-11-21T01:33:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。