論文の概要: Log-concave Sampling from a Convex Body with a Barrier: a Robust and Unified Dikin Walk
- arxiv url: http://arxiv.org/abs/2410.05700v2
- Date: Tue, 12 Nov 2024 19:11:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-14 16:09:01.303827
- Title: Log-concave Sampling from a Convex Body with a Barrier: a Robust and Unified Dikin Walk
- Title(参考訳): バリア付き凸体からの対数凹面サンプリング:ロバストで統一されたダイキンウォーク
- Authors: Yuzhou Gu, Nikki Lijing Kuang, Yi-An Ma, Zhao Song, Lichen Zhang,
- Abstract要約: 我々は、$d$-dimensional log-concave distribution $pi(theta) propto exp(-f(theta))$ for $L$-Lipschitz $f$を考える。
- 参考スコア(独自算出の注目度): 12.842909157175582
- License:
- Abstract: We consider the problem of sampling from a $d$-dimensional log-concave distribution $\pi(\theta) \propto \exp(-f(\theta))$ for $L$-Lipschitz $f$, constrained to a convex body with an efficiently computable self-concordant barrier function, contained in a ball of radius $R$ with a $w$-warm start. We propose a \emph{robust} sampling framework that computes spectral approximations to the Hessian of the barrier functions in each iteration. We prove that for polytopes that are described by $n$ hyperplanes, sampling with the Lee-Sidford barrier function mixes within $\widetilde O((d^2+dL^2R^2)\log(w/\delta))$ steps with a per step cost of $\widetilde O(nd^{\omega-1})$, where $\omega\approx 2.37$ is the fast matrix multiplication exponent. Compared to the prior work of Mangoubi and Vishnoi, our approach gives faster mixing time as we are able to design a generalized soft-threshold Dikin walk beyond log-barrier. We further extend our result to show how to sample from a $d$-dimensional spectrahedron, the constrained set of a semidefinite program, specified by the set $\{x\in \mathbb{R}^d: \sum_{i=1}^d x_i A_i \succeq C \}$ where $A_1,\ldots,A_d, C$ are $n\times n$ real symmetric matrices. We design a walk that mixes in $\widetilde O((nd+dL^2R^2)\log(w/\delta))$ steps with a per iteration cost of $\widetilde O(n^\omega+n^2d^{3\omega-5})$. We improve the mixing time bound of prior best Dikin walk due to Narayanan and Rakhlin that mixes in $\widetilde O((n^2d^3+n^2dL^2R^2)\log(w/\delta))$ steps.
- Abstract(参考訳): 我々は、$d$-dimensional log-concave distribution $\pi(\theta) \propto \exp(-f(\theta))$ for $L$-Lipschitz $f$, noted to a convex body with a efficientcomputable self-concordant barrier function, contained in a radius $R$ with a $w$-warm start。
我々は、$n$超平面で説明されるポリトープに対して、Lee-Sidford障壁関数を用いたサンプリングは、$\widetilde O((d^2+dL^2R^2)\log(w/\delta))$ steps with a step cost of $\widetilde O(nd^{\omega-1})$, where $\omega\approx 2.37$ is the fast matrix multiplication exponent。
Mangoubi と Vishnoi の以前の研究と比較すると、我々のアプローチは、ログバリアを超えて、一般化されたソフトスレッショルドな Dikin ウォークを設計できるため、より高速な混合時間をもたらす。
さらに、この結果を拡張して、半定値プログラムの制約付き集合である$d$-次元 spectrahedron のサンプル方法を示す: ${x\in \mathbb{R}^d: \sum_{i=1}^d x_i A_i \succeq C \}$ ここで、$A_1,\ldots,A_d, C$は$n\times n$実対称行列である。
我々は,$\widetilde O(((nd+dL^2R^2)\log(w/\delta))$の反復コストが$\widetilde O(n^\omega+n^2d^{3\omega-5})$のステップを混合したウォークを設計する。
我々は,ナラヤナンとラークリンによる先進的ディキンウォークの混合時間を改善するために,$\widetilde O((n^2d^3+n^2dL^2R^2)\log(w/\delta))$ stepsを混合する。
- Measuring quantum relative entropy with finite-size effect [53.64687146666141]
論文 参考訳(メタデータ) (2024-06-25T06:07:20Z) - Near-Optimal Distributed Minimax Optimization under the Second-Order Similarity [22.615156512223763]
我々は$mathcal O(delta D2/varepsilon)$、$mathcal O(n+sqrtndelta D2/varepsilon)$、$tildemathcal O(n+sqrtndelta+L)D2/varepsilon)$の局所呼び出しを証明している。
論文 参考訳(メタデータ) (2024-05-25T08:34:49Z) - Solving Dense Linear Systems Faster Than via Preconditioning [1.8854491183340518]
我々のアルゴリズムは$tilde O(n2)$ if $k=O(n0.729)$であることを示す。
特に、我々のアルゴリズムは$tilde O(n2)$ if $k=O(n0.729)$である。
論文 参考訳(メタデータ) (2023-12-14T12:53:34Z) - On the Complexity of Decentralized Smooth Nonconvex Finite-Sum Optimization [21.334985032433778]
分散最適化問題 $min_bf xinmathbb Rd f(bf x)triq frac1msum_i=1m f_i(bf x)triq frac1nsum_j=1n。
論文 参考訳(メタデータ) (2022-10-25T11:37:11Z) - Faster Sampling from Log-Concave Distributions over Polytopes via a
Soft-Threshold Dikin Walk [28.431572772564518]
我々は、$d$-dimensional log-concave distribution $pi(theta) propto e-f(theta)$からポリトープ$K$に制約された$m$不等式をサンプリングする問題を考える。
我々の主な成果は、少なくとも$O((md + d L2 R2) times MDomega-1) log(fracwdelta)$ arithmetic operation to sample from $pi$ の "soft-warm' variant of the Dikin walk Markov chain" である。
論文 参考訳(メタデータ) (2022-06-19T11:33:07Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Threshold Phenomena in Learning Halfspaces with Massart Noise [56.01192577666607]
論文 参考訳(メタデータ) (2021-08-19T16:16:48Z) - Non-Parametric Estimation of Manifolds from Noisy Data [1.0152838128195467]
点推定では$n-frack2k + d$、接空間の推定では$n-frack-12k + d$の収束率を推定する。
論文 参考訳(メタデータ) (2021-05-11T02:29:33Z) - Optimal Mean Estimation without a Variance [103.26777953032537]
論文 参考訳(メタデータ) (2020-11-24T22:39:21Z) - Linear Time Sinkhorn Divergences using Positive Features [51.50788603386766]
エントロピー正則化で最適な輸送を解くには、ベクトルに繰り返し適用される$ntimes n$ kernel matrixを計算する必要がある。
代わりに、$c(x,y)=-logdotpvarphi(x)varphi(y)$ ここで$varphi$は、地上空間から正のorthant $RRr_+$への写像であり、$rll n$である。
論文 参考訳(メタデータ) (2020-06-12T10:21:40Z) - On the Complexity of Minimizing Convex Finite Sums Without Using the
Indices of the Individual Functions [62.01594253618911]
同様のアプローチを踏襲したSVRGの新規な適応法を提案し、これはオラクルと互換性があり、$tildeO(n2+nsqrtL/mu)log (1/epsilon)$と$O(nsqrtL/epsilon)$, for $mu>0$と$mu=0$の複雑さ境界を実現する。
論文 参考訳(メタデータ) (2020-02-09T03:39:46Z)