論文の概要: Characterizing the Generalization Error of Random Feature Regression with Arbitrary Data-Augmentation
- arxiv url: http://arxiv.org/abs/2605.10290v1
- Date: Mon, 11 May 2026 09:52:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.70889
- Title: Characterizing the Generalization Error of Random Feature Regression with Arbitrary Data-Augmentation
- Title(参考訳): 任意データ拡張によるランダム特徴回帰の一般化誤差の特徴付け
- Authors: Lucas Morisset, Alain Durmus, Adrien Hardy,
- Abstract要約: 我々は、データ拡張が比例的なレグレッション手法に誘導する正規化効果を解析する。
実データの集団量のみを用いて平均2乗誤差で測定したテスト誤差の厳密な評価を行う。
- 参考スコア(独自算出の注目度): 12.919305286055616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper aims at analyzing the regularization effect that data augmentation induces on supervised regression methods in the proportional regime, where the number of covariates grows proportionally to the number of samples. We provide a tight characterization of the test error, measured in mean squared error, in terms only of the population quantities of the true data, as well as first and second order statistics of the augmentation scheme. Our results are valid under misspecified feature maps, and for any network architecture where only the last readout layer is trained, and the rest of the network is either frozen or randomly initialized. We specify our results in the case of Gaussian data, and show that our asymptotic characterization is tight in this setting.
- Abstract(参考訳): 本研究の目的は,データの増大が,サンプル数に比例して共変量数が増加する比例関係において,教師付き回帰法を誘導する正規化効果を解析することである。
本報告では,実データの個体数のみを用いて,平均2乗誤差で測定したテスト誤差の厳密な評価と,拡張スキームの1次および2次統計値について述べる。
この結果は,最終読み出し層のみをトレーニングし,残りのネットワークを凍結あるいはランダムに初期化するネットワークアーキテクチャにおいて,不特定機能マップの下で有効である。
ガウスデータの場合の結果を指定し、この設定では漸近的特徴が厳密であることを示す。
関連論文リスト
- High-dimensional logistic regression with missing data: Imputation, regularization, and universality [7.167672851569787]
我々は高次元リッジ規則化ロジスティック回帰について検討する。
予測誤差と推定誤差の両方を正確に評価する。
論文 参考訳(メタデータ) (2024-10-01T21:41:21Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Classification of Heavy-tailed Features in High Dimensions: a
Superstatistical Approach [1.4469725791865984]
我々は2つのデータポイントの雲と一般的なセントロイドの混合の学習を特徴付ける。
得られた推定器の一般化性能について検討し、正規化の役割を解析し、分離性遷移を解析した。
論文 参考訳(メタデータ) (2023-04-06T07:53:05Z) - Fluctuations, Bias, Variance & Ensemble of Learners: Exact Asymptotics
for Convex Losses in High-Dimension [25.711297863946193]
我々は、異なる、しかし相関のある特徴に基づいて訓練された一般化線形モデルの集合における揺らぎの研究の理論を開発する。
一般凸損失と高次元限界における正則化のための経験的リスク最小化器の結合分布の完全な記述を提供する。
論文 参考訳(メタデータ) (2022-01-31T17:44:58Z) - Decentralised Learning with Random Features and Distributed Gradient
Descent [39.00450514924611]
本研究では,不規則な正規化とランダムな特徴を持つ分散グラディエントDescentの均質な環境下での一般化性能について検討する。
ステップサイズ,繰り返し回数,通信行列の逆スペクトルギャップ,ランダム特徴数の関数として,各エージェントの予測性能に高い確率境界を確立する。
本稿では,ランダムな特徴数,イテレーション数,サンプル数が予測性能に与える影響をシミュレーションで示す。
論文 参考訳(メタデータ) (2020-07-01T09:55:09Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Online stochastic gradient descent on non-convex losses from
high-dimensional inference [2.2344764434954256]
勾配降下(SGD)は高次元タスクにおける最適化問題に対する一般的なアルゴリズムである。
本稿では,データから非自明な相関関係を推定する。
本稿では、位相探索や一般化モデルの推定といった一連のタスクに適用することで、我々のアプローチを説明する。
論文 参考訳(メタデータ) (2020-03-23T17:34:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。