Fugu-MT 論文翻訳(概要): Precise Asymptotic Analysis of Deep Random Feature Models

論文の概要: Precise Asymptotic Analysis of Deep Random Feature Models

arxiv url: http://arxiv.org/abs/2302.06210v1
Date: Mon, 13 Feb 2023 09:30:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-14 16:05:48.351797
Title: Precise Asymptotic Analysis of Deep Random Feature Models
Title（参考訳）: 深部ランダム特徴モデルの高精度漸近解析
Authors: David Bosch, Ashkan Panahi, Babak Hassibi
Abstract要約: 我々は、$L-$layer Deep random Feature (RF)モデルによる回帰の正確な表現を提供する。等価ガウスモデルの異なる層における固有分布の変動を特徴付ける。
参考スコア（独自算出の注目度）: 37.35013316704277
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We provide exact asymptotic expressions for the performance of regression by an $L-$layer deep random feature (RF) model, where the input is mapped through multiple random embedding and non-linear activation functions. For this purpose, we establish two key steps: First, we prove a novel universality result for RF models and deterministic data, by which we demonstrate that a deep random feature model is equivalent to a deep linear Gaussian model that matches it in the first and second moments, at each layer. Second, we make use of the convex Gaussian Min-Max theorem multiple times to obtain the exact behavior of deep RF models. We further characterize the variation of the eigendistribution in different layers of the equivalent Gaussian model, demonstrating that depth has a tangible effect on model performance despite the fact that only the last layer of the model is being trained.
Abstract（参考訳）: 我々は,$l-$layer deep random feature (rf)モデルによる回帰性能の正確な漸近表現を提供し,入力は複数のランダム埋め込み関数と非線形活性化関数によってマッピングされる。まず、rfモデルと決定論的データに対する新しい普遍性(universality results)を証明し、各層において、深いランダム特徴モデルが、第1および第2の瞬間に一致する深い線形ガウスモデルと等価であることを実証する。第二に、深部RFモデルの正確な振る舞いを得るために、凸ガウスのMin-Max定理を複数回使います。さらに、等価ガウスモデルの異なる層における固有分布の変動を特徴付け、モデルの最後の層のみが訓練されているにもかかわらず、モデルの性能に明らかな影響があることを実証する。

関連論文リスト

When does Gaussian equivalence fail and how to fix it: Non-universal behavior of random features with quadratic scaling [15.148577493784051]
ガウス同値理論 (GET) は、高次元の複素特徴の挙動をガウス級数によって捉えることができると述べている。しかし、数値実験により、この同値性は一般的なスケーリング体制下での単純な埋め込みでも失敗する可能性があることが示されている。我々は、低次元のガウス成分を高次元ガウスモデルに付加すると考えられる条件等価(CGE)モデルを導入する。
論文参考訳（メタデータ） (2025-12-03T00:23:12Z)
Two-Point Deterministic Equivalence for Stochastic Gradient Dynamics in Linear Models [76.52307406752556]
ランダムリゾルダーの2点関数に対する新しい決定論的等価性を導出する。勾配勾配を有する多種多様な高次元学習線形モデルの性能を統一的に導出する。
論文参考訳（メタデータ） (2025-02-07T16:45:40Z)
von Mises Quasi-Processes for Bayesian Circular Regression [57.88921637944379]
円値ランダム関数上の表現的および解釈可能な分布の族を探索する。結果の確率モデルは、統計物理学における連続スピンモデルと関係を持つ。後続推論のために、高速マルコフ連鎖モンテカルロサンプリングに寄与するストラトノビッチのような拡張を導入する。
論文参考訳（メタデータ） (2024-06-19T01:57:21Z)
Characteristic Learning for Provable One Step Generation [12.620728925515012]
本稿では,GAN(Generative Adversarial Networks)におけるサンプリング効率とフローベースモデルの安定した性能を組み合わせた一段階生成モデルを提案する。我々のモデルは、確率密度輸送を通常の微分方程式(ODE)で記述できる特性によって駆動される。深層ニューラルネットワークはこれらの特徴に適合するように訓練され、単純なガウス分布を目標分布にプッシュするワンステップマップを生成する。
論文参考訳（メタデータ） (2024-05-09T02:41:42Z)
Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文参考訳（メタデータ） (2024-05-01T15:59:00Z)
Deep Latent Force Models: ODE-based Process Convolutions for Bayesian Deep Learning [0.0]
深潜力モデル (DLFM) は、各層に物理インフォームドカーネルを持つ深いガウス過程である。我々はDLFMの非線形実世界の時系列データに現れるダイナミクスを捉える能力の実証的証拠を提示する。 DLFMは,非物理インフォームド確率モデルに匹敵する性能を達成できることがわかった。
論文参考訳（メタデータ） (2023-11-24T19:55:57Z)
Max-affine regression via first-order methods [7.12511675782289]
最大アフィンモデルは信号処理と統計学の応用においてユビキタスに現れる。最大アフィン回帰に対する勾配降下(GD)とミニバッチ勾配降下(SGD)の非漸近収束解析を行った。
論文参考訳（メタデータ） (2023-08-15T23:46:44Z)
Double Descent in Random Feature Models: Precise Asymptotic Analysis for General Convex Regularization [4.8900735721275055]
より広い凸正規化項のクラスの下で回帰の一般化を正確に表現する。我々は,本フレームワークの予測能力を数値的に示すとともに,非漸近的状態においても予測されたテスト誤差が正確であることを実験的に示す。
論文参考訳（メタデータ） (2022-04-06T08:59:38Z)
On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。理論的にも経験的にも二重降下現象を観察する。
論文参考訳（メタデータ） (2021-10-13T17:47:39Z)
Provable Model-based Nonlinear Bandit and Reinforcement Learning: Shelve Optimism, Embrace Virtual Curvature [61.22680308681648]
決定論的報酬を有する1層ニューラルネットバンディットにおいても,グローバル収束は統計的に難解であることを示す。非線形バンディットとRLの両方に対して,オンラインモデル学習者による仮想アセンジ(Virtual Ascent with Online Model Learner)というモデルベースアルゴリズムを提案する。
論文参考訳（メタデータ） (2021-02-08T12:41:56Z)
Anomaly Detection of Time Series with Smoothness-Inducing Sequential Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文参考訳（メタデータ） (2021-02-02T06:15:15Z)
Goal-directed Generation of Discrete Structures with Conditional Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文参考訳（メタデータ） (2020-10-05T20:03:13Z)
Maximum Entropy Model Rollouts: Fast Model Based Policy Optimization without Compounding Errors [10.906666680425754]
我々は、最大エントロピーモデルロールアウト(MEMR)と呼ばれるダイナスタイルモデルに基づく強化学習アルゴリズムを提案する。複雑なエラーをなくすために、我々はモデルを使って単一ステップのロールアウトを生成する。
論文参考訳（メタデータ） (2020-06-08T21:38:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。