論文の概要: Variational Orthogonal Features
- arxiv url: http://arxiv.org/abs/2006.13170v1
- Date: Tue, 23 Jun 2020 17:18:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 22:17:23.671822
- Title: Variational Orthogonal Features
- Title(参考訳): 変分直交的特徴
- Authors: David R. Burt, Carl Edward Rasmussen, Mark van der Wilk
- Abstract要約: 我々は,ある先行して,エビデンスローバウンド(ELBO)のミニバッチ推定を$mathcalO(M3)$コストで計算する機能を定義できることを示す。
我々は,不偏推定器をELBOに,$mathcalO(tildeNT+M2T)$および$mathcalO(tildeNT+MT)$で$T$ Monte Carloサンプルを用いて計算できる固定前カーネルの構成について述べる。
- 参考スコア(独自算出の注目度): 29.636483122130027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sparse stochastic variational inference allows Gaussian process models to be
applied to large datasets. The per iteration computational cost of inference
with this method is $\mathcal{O}(\tilde{N}M^2+M^3),$ where $\tilde{N}$ is the
number of points in a minibatch and $M$ is the number of `inducing features',
which determine the expressiveness of the variational family. Several recent
works have shown that for certain priors, features can be defined that remove
the $\mathcal{O}(M^3)$ cost of computing a minibatch estimate of an evidence
lower bound (ELBO). This represents a significant computational savings when
$M\gg \tilde{N}$. We present a construction of features for any stationary
prior kernel that allow for computation of an unbiased estimator to the ELBO
using $T$ Monte Carlo samples in $\mathcal{O}(\tilde{N}T+M^2T)$ and in
$\mathcal{O}(\tilde{N}T+MT)$ with an additional approximation. We analyze the
impact of this additional approximation on inference quality.
- Abstract(参考訳): スパース確率変動推論により、ガウス過程モデルを大きなデータセットに適用することができる。
この方法での1イテレーションあたりの計算コストは$\mathcal{o}(\tilde{n}m^2+m^3)であり、ここで$\tilde{n}$はミニバッチ内の点数、$m$は変分群の表現性を決定する「誘導的特徴数」である。
いくつかの最近の研究は、ある先行して、エビデンスローバウンド(ELBO)のミニバッチ推定を$\mathcal{O}(M^3)$コストで計算する機能を定義できることを示した。
これは$M\gg \tilde{N}$のときの計算の大幅な節約を意味する。
我々は,不偏推定器をELBOに計算するために,$T$ Monte Carloサンプルを$\mathcal{O}(\tilde{N}T+M^2T)$,$\mathcal{O}(\tilde{N}T+MT)$と$\mathcal{O}(\tilde{N}T+MT)$に付加近似を加えて構成する。
この追加近似が推論品質に与える影響を分析した。
関連論文リスト
- Sample and Computationally Efficient Robust Learning of Gaussian Single-Index Models [37.42736399673992]
シングルインデックスモデル (SIM) は $sigma(mathbfwast cdot mathbfx)$ という形式の関数であり、$sigma: mathbbR to mathbbR$ は既知のリンク関数であり、$mathbfwast$ は隠れ単位ベクトルである。
適切な学習者が$L2$-error of $O(mathrmOPT)+epsilon$。
論文 参考訳(メタデータ) (2024-11-08T17:10:38Z) - Inverting the Leverage Score Gradient: An Efficient Approximate Newton Method [10.742859956268655]
本稿では,レバレッジスコア勾配から固有モデルパラメータを復元することを目的とする。
具体的には、レバレッジスコア勾配の逆転を$g(x)$として精査する。
論文 参考訳(メタデータ) (2024-08-21T01:39:42Z) - Learning a Single Neuron with Adversarial Label Noise via Gradient
Descent [50.659479930171585]
モノトン活性化に対する $mathbfxmapstosigma(mathbfwcdotmathbfx)$ の関数について検討する。
学習者の目標は仮説ベクトル $mathbfw$ that $F(mathbbw)=C, epsilon$ を高い確率で出力することである。
論文 参考訳(メタデータ) (2022-06-17T17:55:43Z) - Random matrices in service of ML footprint: ternary random features with
no performance loss [55.30329197651178]
我々は、$bf K$ の固有スペクトルが$bf w$ の i.d. 成分の分布とは独立であることを示す。
3次ランダム特徴(TRF)と呼ばれる新しいランダム手法を提案する。
提案したランダムな特徴の計算には乗算が不要であり、古典的なランダムな特徴に比べてストレージに$b$のコストがかかる。
論文 参考訳(メタデータ) (2021-10-05T09:33:49Z) - Non-Parametric Estimation of Manifolds from Noisy Data [1.0152838128195467]
ノイズの多いサンプルの有限集合から$mathbbRD$の$d$次元部分多様体を推定する問題を検討する。
点推定では$n-frack2k + d$、接空間の推定では$n-frack-12k + d$の収束率を推定する。
論文 参考訳(メタデータ) (2021-05-11T02:29:33Z) - Sparse sketches with small inversion bias [79.77110958547695]
逆バイアスは、逆の共分散に依存する量の推定を平均化するときに生じる。
本研究では、確率行列に対する$(epsilon,delta)$-unbiased estimatorという概念に基づいて、逆バイアスを解析するためのフレームワークを開発する。
スケッチ行列 $S$ が密度が高く、すなわちサブガウスのエントリを持つとき、$(epsilon,delta)$-unbiased for $(Atop A)-1$ は $m=O(d+sqrt d/ のスケッチを持つ。
論文 参考訳(メタデータ) (2020-11-21T01:33:15Z) - List-Decodable Mean Estimation in Nearly-PCA Time [50.79691056481693]
高次元におけるリストデコタブル平均推定の基本的な課題について検討する。
我々のアルゴリズムは、すべての$k = O(sqrtd) cup Omega(d)$に対して$widetildeO(ndk)$で実行されます。
我々のアルゴリズムの変種は、すべての$k$に対してランタイム$widetildeO(ndk)$を持ち、リカバリ保証の$O(sqrtlog k)$ Factorを犠牲にしている。
論文 参考訳(メタデータ) (2020-11-19T17:21:37Z) - Convergence of Sparse Variational Inference in Gaussian Processes
Regression [29.636483122130027]
計算コストが$mathcalO(log N)2D(log N)2)$の手法を推論に利用できることを示す。
論文 参考訳(メタデータ) (2020-08-01T19:23:34Z) - Linear Time Sinkhorn Divergences using Positive Features [51.50788603386766]
エントロピー正則化で最適な輸送を解くには、ベクトルに繰り返し適用される$ntimes n$ kernel matrixを計算する必要がある。
代わりに、$c(x,y)=-logdotpvarphi(x)varphi(y)$ ここで$varphi$は、地上空間から正のorthant $RRr_+$への写像であり、$rll n$である。
論文 参考訳(メタデータ) (2020-06-12T10:21:40Z) - A Randomized Algorithm to Reduce the Support of Discrete Measures [79.55586575988292]
離散確率測度が$N$原子と$n$実数値関数の集合で成り立つと、元の$N$原子の$n+1$の部分集合で支えられる確率測度が存在する。
我々は、負の円錐によるバリセンターの簡単な幾何学的特徴付けを与え、この新しい測度を「グリード幾何学的サンプリング」によって計算するランダム化アルゴリズムを導出する。
次に、その性質を研究し、それを合成および実世界のデータにベンチマークして、$Ngg n$ regimeにおいて非常に有益であることを示す。
論文 参考訳(メタデータ) (2020-06-02T16:38:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。