Fugu-MT 論文翻訳(概要): Overparameterization and generalization error: weighted trigonometric interpolation

論文の概要: Overparameterization and generalization error: weighted trigonometric interpolation

arxiv url: http://arxiv.org/abs/2006.08495v3
Date: Wed, 27 Oct 2021 19:39:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-21 03:50:55.090384
Title: Overparameterization and generalization error: weighted trigonometric interpolation
Title（参考訳）: 過パラメータ化と一般化誤差:重み付き三角補間
Authors: Yuege Xie, Hung-Hsu Chou, Holger Rauhut, Rachel Ward
Abstract要約: 本研究では,未知のフーリエ係数を等価試料から推定するランダムフーリエ級数モデルについて検討する。滑らかな補間物に対する偏りが、重み付き三角法一般化の形でどのようにしてより小さい一般化誤差をもたらすかを正確に示す。
参考スコア（独自算出の注目度）: 4.631723879329972
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Motivated by surprisingly good generalization properties of learned deep neural networks in overparameterized scenarios and by the related double descent phenomenon, this paper analyzes the relation between smoothness and low generalization error in an overparameterized linear learning problem. We study a random Fourier series model, where the task is to estimate the unknown Fourier coefficients from equidistant samples. We derive exact expressions for the generalization error of both plain and weighted least squares estimators. We show precisely how a bias towards smooth interpolants, in the form of weighted trigonometric interpolation, can lead to smaller generalization error in the overparameterized regime compared to the underparameterized regime. This provides insight into the power of overparameterization, which is common in modern machine learning.
Abstract（参考訳）: 過パラメータ化シナリオにおける学習深部ニューラルネットワークの驚くほど良い一般化特性と関連する二重降下現象により、過パラメータ化線形学習問題における滑らかさと低一般化誤差の関係を解析した。本研究では,未知のフーリエ係数を等価試料から推定するランダムフーリエ級数モデルについて検討する。平面および重み付き最小二乗推定器の一般化誤差の正確な式を導出する。我々は, 平滑な補間物に対する偏差が, 重み付き三角波補間という形で, 過パラメータ化状態の一般化誤差を減少させることを示す。これは、現代の機械学習で一般的な過パラメータ化のパワーに関する洞察を提供する。

関連論文リスト

Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文参考訳（メタデータ） (2024-10-22T10:19:27Z)
Generalization for Least Squares Regression With Simple Spiked Covariances [3.9134031118910264]
勾配降下によって訓練された2層ニューラルネットワークの一般化特性はいまだよく分かっていない。最近の研究は、隠れた層における特徴行列のスペクトルを記述することで進展した。しかし、スパイク共分散を持つ線形モデルの一般化誤差は以前には決定されていない。
論文参考訳（メタデータ） (2024-10-17T19:46:51Z)
Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文参考訳（メタデータ） (2024-05-01T15:59:00Z)
A U-turn on Double Descent: Rethinking Parameter Counting in Statistical Learning [68.76846801719095]
二重降下がいつどこで起こるのかを正確に示し、その位置が本質的に閾値 p=n に結び付けられていないことを示す。これは二重降下と統計的直観の間の緊張を解消する。
論文参考訳（メタデータ） (2023-10-29T12:05:39Z)
The Inductive Bias of Flatness Regularization for Deep Matrix Factorization [58.851514333119255]
この研究は、ディープ線形ネットワークにおけるヘッセン解の最小トレースの帰納バイアスを理解するための第一歩となる。測定値の標準等尺性(RIP)が1より大きいすべての深さについて、ヘッセンのトレースを最小化することは、対応する終端行列パラメータのシャッテン 1-ノルムを最小化するのとほぼ同値であることを示す。
論文参考訳（メタデータ） (2023-06-22T23:14:57Z)
Instance-Dependent Generalization Bounds via Optimal Transport [51.71650746285469]
既存の一般化境界は、現代のニューラルネットワークの一般化を促進する重要な要因を説明することができない。データ空間における学習予測関数の局所リプシッツ正則性に依存するインスタンス依存の一般化境界を導出する。ニューラルネットワークに対する一般化境界を実験的に解析し、有界値が有意義であることを示し、トレーニング中の一般的な正規化方法の効果を捉える。
論文参考訳（メタデータ） (2022-11-02T16:39:42Z)
Fluctuations, Bias, Variance & Ensemble of Learners: Exact Asymptotics for Convex Losses in High-Dimension [25.711297863946193]
我々は、異なる、しかし相関のある特徴に基づいて訓練された一般化線形モデルの集合における揺らぎの研究の理論を開発する。一般凸損失と高次元限界における正則化のための経験的リスク最小化器の結合分布の完全な記述を提供する。
論文参考訳（メタデータ） (2022-01-31T17:44:58Z)
Post-mortem on a deep learning contest: a Simpson's paradox and the complementary roles of scale metrics versus shape metrics [61.49826776409194]
我々は、ニューラルネットワーク(NN)モデルの一般化精度を予測するために、コンテストで公に利用可能にされたモデルのコーパスを分析する。メトリクスが全体としてよく機能するが、データのサブパーティションではあまり機能しない。本稿では,データに依存しない2つの新しい形状指標と,一連のNNのテスト精度の傾向を予測できるデータ依存指標を提案する。
論文参考訳（メタデータ） (2021-06-01T19:19:49Z)
Understanding Double Descent Requires a Fine-Grained Bias-Variance Decomposition [34.235007566913396]
ラベルに関連付けられた用語への分散の解釈可能で対称的な分解について述べる。バイアスはネットワーク幅とともに単調に減少するが、分散項は非単調な振る舞いを示す。我々はまた、著しく豊かな現象論も分析する。
論文参考訳（メタデータ） (2020-11-04T21:04:02Z)
Memorizing without overfitting: Bias, variance, and interpolation in over-parameterized models [0.0]
バイアス分散トレードオフは教師あり学習における中心的な概念である。現代のDeep Learningメソッドは、最先端のパフォーマンスを達成するために、このドグマを浮かび上がらせる。
論文参考訳（メタデータ） (2020-10-26T22:31:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。