Fugu-MT 論文翻訳(概要): Analysing heavy-tail properties of Stochastic Gradient Descent by means of Stochastic Recurrence Equations

論文の概要: Analysing heavy-tail properties of Stochastic Gradient Descent by means of Stochastic Recurrence Equations

arxiv url: http://arxiv.org/abs/2403.13868v1
Date: Wed, 20 Mar 2024 13:39:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-22 18:18:59.172678
Title: Analysing heavy-tail properties of Stochastic Gradient Descent by means of Stochastic Recurrence Equations
Title（参考訳）: 確率的再帰方程式による確率的グラディエントDescentの重テール特性の解析
Authors: Ewa Damek, Sebastian Mentemeier,
Abstract要約: 近年の研究では、グラディエント蛍光(SGD)の重いテール特性が再帰の確率的枠組みで研究されている。我々は、引用された論文のいくつかのオープンな質問に答え、既約確率 (i-p) 行列の理論を適用して結果を拡張する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In recent works on the theory of machine learning, it has been observed that heavy tail properties of Stochastic Gradient Descent (SGD) can be studied in the probabilistic framework of stochastic recursions. In particular, G\"{u}rb\"{u}zbalaban et al. (arXiv:2006.04740) considered a setup corresponding to linear regression for which iterations of SGD can be modelled by a multivariate affine stochastic recursion $X_k=A_k X_{k-1}+B_k$, for independent and identically distributed pairs $(A_k, B_k)$, where $A_k$ is a random symmetric matrix and $B_k$ is a random vector. In this work, we will answer several open questions of the quoted paper and extend their results by applying the theory of irreducible-proximal (i-p) matrices.
Abstract（参考訳）: 近年の機械学習理論において,確率的再帰の確率的枠組みにおいて,確率的勾配 Descent (SGD) の重いテール特性が研究されている。特に、G\"{u}rb\"{u}zbalaban et al (arXiv:2006.04740) は、A_k$ がランダム対称行列であり、$B_k$ がランダムなベクトルであるような独立かつ同一に分散されたペアに対して、SGD の反復を多変量アフィン確率再帰 $X_k=A_k X_{k-1}+B_k$ でモデル化できる線形回帰に対応する構成を考えた。この研究では、引用された論文のいくつかのオープンな質問に答え、既約(i-p)行列の理論を適用して結果を拡張する。

関連論文リスト

High-dimensional ridge regression with random features for non-identically distributed data with a variance profile [0.0]
高次元回帰フレームワークにおけるランダム特徴モデルの振る舞いは、機械学習の文献に注目される問題となっている。非イド特徴ベクトルの設定におけるランダム特徴モデルの性能について検討する。
論文参考訳（メタデータ） (2025-04-03T21:20:08Z)
$p$-Adic Polynomial Regression as Alternative to Neural Network for Approximating $p$-Adic Functions of Many Variables [55.2480439325792]
任意の精度で連続関数を近似できる回帰モデルを構築している。提案モデルは、ニューラルネットワークアーキテクチャに基づく$p$-adicモデルの簡単な代替と見なすことができる。
論文参考訳（メタデータ） (2025-03-30T15:42:08Z)
Two-Point Deterministic Equivalence for Stochastic Gradient Dynamics in Linear Models [76.52307406752556]
ランダムリゾルダーの2点関数に対する新しい決定論的等価性を導出する。勾配勾配を有する多種多様な高次元学習線形モデルの性能を統一的に導出する。
論文参考訳（メタデータ） (2025-02-07T16:45:40Z)
Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文参考訳（メタデータ） (2024-03-08T18:50:19Z)
Accurate and Scalable Stochastic Gaussian Process Regression via Learnable Coreset-based Variational Inference [8.077736581030264]
本稿では,ガウス過程(mathcalGP$)回帰に対する新しい帰納的変分推定法を提案する。従来の推論用自由形式変動型族とは異なり、コアセットベースの変動型 $mathcalGP$ (CVGP) は $mathcalGP$ pre と (重み付き) データの確率で定義される。
論文参考訳（メタデータ） (2023-11-02T17:22:22Z)
Probabilistic Unrolling: Scalable, Inverse-Free Maximum Likelihood Estimation for Latent Gaussian Models [69.22568644711113]
我々は,モンテカルロサンプリングと反復線形解法を組み合わせた確率的アンローリングを導入し,行列逆転を回避した。理論的解析により,解法の繰り返しによる解法の解法と逆転が最大値推定の勾配推定を高速化することを示した。シミュレーションおよび実データ実験において、確率的アンロールは、モデル性能の損失を最小限に抑えながら、勾配EMよりも桁違いに高速な潜在ガウスモデルを学習することを示した。
論文参考訳（メタデータ） (2023-06-05T21:08:34Z)
Robust Regularized Low-Rank Matrix Models for Regression and Classification [14.698622796774634]
本稿では,ランク制約,ベクトル正規化(疎性など),一般損失関数に基づく行列変分回帰モデルのフレームワークを提案する。アルゴリズムは収束することが保証されており、アルゴリズムのすべての累積点が$O(sqrtn)$100の順序で推定誤差を持ち、最小値の精度をほぼ達成していることを示す。
論文参考訳（メタデータ） (2022-05-14T18:03:48Z)
Optimal Online Generalized Linear Regression with Stochastic Noise and Its Application to Heteroscedastic Bandits [88.6139446295537]
一般化線形モデルの設定におけるオンライン一般化線形回帰の問題について検討する。ラベルノイズに対処するため、古典的追従正規化リーダ(FTRL)アルゴリズムを鋭く解析する。本稿では,FTRLに基づくアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-02-28T08:25:26Z)
When Random Tensors meet Random Matrices [50.568841545067144]
本稿では,ガウス雑音を伴う非対称次数-$d$スパイクテンソルモデルについて検討する。検討したモデルの解析は、等価なスパイクされた対称テクシットブロック-ワイドランダム行列の解析に起因していることを示す。
論文参考訳（メタデータ） (2021-12-23T04:05:01Z)
A Precise Performance Analysis of Support Vector Regression [105.94855998235232]
我々は,n$の線形測定に応用したハードおよびソフトサポートベクター回帰法について検討した。得られた結果は、ハードおよびソフトサポートベクトル回帰アルゴリズムの設計に介入するパラメータを最適に調整するために使用される。
論文参考訳（メタデータ） (2021-05-21T14:26:28Z)
Linear-Sample Learning of Low-Rank Distributions [56.59844655107251]
ktimes k$, rank-r$, matrices to normalized $L_1$ distance requires $Omega(frackrepsilon2)$ sample。我々は、$cal O(frackrepsilon2log2fracepsilon)$ sample, a number linear in the high dimension, and almost linear in the matrices, usually low, rank proofs.というアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-09-30T19:10:32Z)
Tight Nonparametric Convergence Rates for Stochastic Gradient Descent under the Noiseless Linear Model [0.0]
このモデルに基づく最小二乗リスクに対する1パス, 固定段差勾配勾配の収束度を解析した。特殊な場合として、ランダムなサンプリング点における値のノイズのない観測から単位区間上の実関数を推定するオンラインアルゴリズムを解析する。
論文参考訳（メタデータ） (2020-06-15T08:25:50Z)
Quadruply Stochastic Gaussian Processes [10.152838128195466]
本稿では,スケーラブルなガウス過程(GP)モデルをトレーニングするための変分推論手法を提案する。この手法は,トレーニング点数,$n$,カーネル近似で使用される数基底関数,$m$のいずれにも依存しない。 GPと関連ベクトルマシンを用いた大規模分類および回帰データセットの精度を,最大で$m = 107$の基底関数で示す。
論文参考訳（メタデータ） (2020-06-04T17:06:25Z)
Asymptotic errors for convex penalized linear regression beyond Gaussian matrices [23.15629681360836]
雑音線形観測から係数ベクトル$x_0$ in$RN$を学習する問題を考察する。平均二乗誤差に対する明示的な式を厳密に導出する。我々の予測は、非常に適度なサイズであっても、数値と非常によく一致していることを示す。
論文参考訳（メタデータ） (2020-02-11T13:43:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。