Fugu-MT 論文翻訳(概要): Spectrum Dependent Learning Curves in Kernel Regression and Wide Neural Networks

論文の概要: Spectrum Dependent Learning Curves in Kernel Regression and Wide Neural Networks

arxiv url: http://arxiv.org/abs/2002.02561v7
Date: Thu, 25 Feb 2021 18:40:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-03 03:42:03.054617
Title: Spectrum Dependent Learning Curves in Kernel Regression and Wide Neural Networks
Title（参考訳）: カーネル回帰とワイドニューラルネットワークにおけるスペクトル依存学習曲線
Authors: Blake Bordelon, Abdulkadir Canatar, Cengiz Pehlevan
Abstract要約: トレーニングサンプル数の関数として,カーネル回帰の一般化性能に関する解析式を導出する。我々の表現は、トレーニングとニューラルカーネル・タンジェント(NTK)によるカーネル回帰の等価性により、広いニューラルネットワークに適用される。我々は、合成データとMNISTデータセットのシミュレーションを用いて、我々の理論を検証する。
参考スコア（独自算出の注目度）: 17.188280334580195
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We derive analytical expressions for the generalization performance of kernel regression as a function of the number of training samples using theoretical methods from Gaussian processes and statistical physics. Our expressions apply to wide neural networks due to an equivalence between training them and kernel regression with the Neural Tangent Kernel (NTK). By computing the decomposition of the total generalization error due to different spectral components of the kernel, we identify a new spectral principle: as the size of the training set grows, kernel machines and neural networks fit successively higher spectral modes of the target function. When data are sampled from a uniform distribution on a high-dimensional hypersphere, dot product kernels, including NTK, exhibit learning stages where different frequency modes of the target function are learned. We verify our theory with simulations on synthetic data and MNIST dataset.
Abstract（参考訳）: ガウス過程と統計物理学の理論的手法を用いて,カーネル回帰の一般化性能に関する解析式をトレーニングサンプル数関数として導出した。我々の表現は、トレーニングとニューラルタンジェントカーネル(NTK)によるカーネル回帰の等価性により、広いニューラルネットワークに適用される。カーネルのスペクトル成分の違いによる全一般化誤差の分解を計算することにより、トレーニングセットのサイズが大きくなるにつれて、カーネルマシンとニューラルネットワークはターゲット関数のスペクトルモードを順次高めるという新しいスペクトル原理を同定する。高次元超球面上の均一分布からデータをサンプリングすると、NTKを含むドット製品カーネルは、対象関数の異なる周波数モードが学習される学習段階を示す。我々は合成データとMNISTデータセットのシミュレーションを用いて理論を検証する。

関連論文リスト

Generalization Bound of Gradient Flow through Training Trajectory and Data-dependent Kernel [55.82768375605861]
我々は、カーネル法における古典的ラデマッハ複雑性と整合する勾配流の一般化を確立する。 NTKのような静的カーネルとは異なり、LPKはトレーニング軌跡全体をキャプチャし、データと最適化の両方に適応する。
論文参考訳（メタデータ） (2025-06-12T23:17:09Z)
Neural Tangent Kernels Motivate Graph Neural Networks with Cross-Covariance Graphs [94.44374472696272]
グラフニューラルネットワーク(GNN)の文脈におけるNTKとアライメントについて検討する。その結果、2層GNNのアライメントの最適性に関する理論的保証が確立された。これらの保証は、入力と出力データの相互共分散の関数であるグラフシフト演算子によって特徴づけられる。
論文参考訳（メタデータ） (2023-10-16T19:54:21Z)
A theory of data variability in Neural Network Bayesian inference [0.70224924046445]
無限広ネットワークの一般化特性をカバーする場理論形式論を提供する。入力の統計的性質から一般化特性を導出する。データ可変性は、(varphi3+varphi4$)-理論を思い起こさせる非ガウス的作用をもたらすことを示す。
論文参考訳（メタデータ） (2023-07-31T14:11:32Z)
Gradient Descent in Neural Networks as Sequential Learning in RKBS [63.011641517977644]
初期重みの有限近傍にニューラルネットワークの正確な電力系列表現を構築する。幅にかかわらず、勾配降下によって生成されたトレーニングシーケンスは、正規化された逐次学習によって正確に複製可能であることを証明した。
論文参考訳（メタデータ） (2023-02-01T03:18:07Z)
Spectral Complexity-scaled Generalization Bound of Complex-valued Neural Networks [78.64167379726163]
本論文は,複素数値ニューラルネットワークの一般化を証明した最初の論文である。複雑な値の畳み込みニューラルネットワークを異なるデータセット上でトレーニングして実験を行う。
論文参考訳（メタデータ） (2021-12-07T03:25:25Z)
Uniform Generalization Bounds for Overparameterized Neural Networks [5.945320097465419]
カーネルシステムにおけるオーバーパラメータ化ニューラルネットワークに対する一様一般化バウンダリを証明した。我々の境界は、アクティベーション関数の微分可能性に応じて正確な誤差率をキャプチャする。 NTカーネルに対応するRKHSと、Mat'ernカーネルのファミリーに対応するRKHSの等価性を示す。
論文参考訳（メタデータ） (2021-09-13T16:20:13Z)
Scaling Neural Tangent Kernels via Sketching and Random Features [53.57615759435126]
最近の研究報告では、NTKレグレッションは、小規模データセットでトレーニングされた有限範囲のニューラルネットワークより優れている。我々は、アークコサインカーネルの拡張をスケッチして、NTKの近距離入力スパーシティ時間近似アルゴリズムを設計する。 CNTKの特徴をトレーニングした線形回帰器が,CIFAR-10データセット上での正確なCNTKの精度と150倍の高速化を実現していることを示す。
論文参考訳（メタデータ） (2021-06-15T04:44:52Z)
Out-of-Distribution Generalization in Kernel Regression [21.958028127426196]
トレーニングとテストの分布が異なる場合のカーネル回帰の一般化について検討する。与えられたカーネルの分布間のミスマッチを定量化する重なり行列を同定する。本研究では,データ予算に対するトレーニングとテストの配分を最適化する手法を開発し,そのシフトの下で最良のケースと最悪のケースの一般化を求める。
論文参考訳（メタデータ） (2021-06-04T04:54:25Z)
Random Features for the Neural Tangent Kernel [57.132634274795066]
完全接続型ReLUネットワークのニューラルタンジェントカーネル(NTK)の効率的な特徴マップ構築を提案する。得られた特徴の次元は、理論と実践の両方で比較誤差境界を達成するために、他のベースライン特徴マップ構造よりもはるかに小さいことを示しています。
論文参考訳（メタデータ） (2021-04-03T09:08:12Z)
Double-descent curves in neural networks: a new perspective using Gaussian processes [9.153116600213641]
ニューラルネットワークの二重輝線曲線は、一般化誤差が最初にパラメータの増加とともに下降し、最適数のパラメータに達した後に成長する現象を記述している。本稿では,ニューラルネットワークガウス過程カーネルのスペクトルの幅依存性として,経験的特徴共分散行列のスペクトル分布を特徴付けるために,ランダム行列理論の手法を用いる。
論文参考訳（メタデータ） (2021-02-14T20:31:49Z)
Spectral Bias and Task-Model Alignment Explain Generalization in Kernel Regression and Infinitely Wide Neural Networks [17.188280334580195]
トレーニングデータセットを越えた一般化は、マシンラーニングの主な目標である。最近のディープニューラルネットワークの観測は、古典統計学の従来の知恵と矛盾している。より多くのデータが、カーネルがノイズや表現できないときに一般化を損なう可能性があることを示す。
論文参考訳（メタデータ） (2020-06-23T17:53:11Z)
Multipole Graph Neural Operator for Parametric Partial Differential Equations [57.90284928158383]
物理系をシミュレーションするためのディープラーニングベースの手法を使用する際の大きな課題の1つは、物理ベースのデータの定式化である。線形複雑度のみを用いて、あらゆる範囲の相互作用をキャプチャする、新しいマルチレベルグラフニューラルネットワークフレームワークを提案する。実験により, 離散化不変解演算子をPDEに学習し, 線形時間で評価できることを確認した。
論文参考訳（メタデータ） (2020-06-16T21:56:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。