論文の概要: Concentration of Random Feature Matrices in High-Dimensions
- arxiv url: http://arxiv.org/abs/2204.06935v1
- Date: Thu, 14 Apr 2022 13:01:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 13:04:14.653136
- Title: Concentration of Random Feature Matrices in High-Dimensions
- Title(参考訳): 高次元におけるランダム特徴量濃度
- Authors: Zhijun Chen, Hayden Schaeffer, Rachel Ward
- Abstract要約: ランダムな特徴行列のスペクトルは、ランダムな特徴回帰問題に使用される線形システムの条件付けに関する情報を提供する。
2つの入力変数に対する2つの設定を考える。どちらもランダム変数か、一方はランダム変数で、もう一方は十分に分離されている。
- 参考スコア(独自算出の注目度): 7.1171757928258135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The spectra of random feature matrices provide essential information on the
conditioning of the linear system used in random feature regression problems
and are thus connected to the consistency and generalization of random feature
models. Random feature matrices are asymmetric rectangular nonlinear matrices
depending on two input variables, the data and the weights, which can make
their characterization challenging. We consider two settings for the two input
variables, either both are random variables or one is a random variable and the
other is well-separated, i.e. there is a minimum distance between points. With
conditions on the dimension, the complexity ratio, and the sampling variance,
we show that the singular values of these matrices concentrate near their full
expectation and near one with high-probability. In particular, since the
dimension depends only on the logarithm of the number of random weights or the
number of data points, our complexity bounds can be achieved even in moderate
dimensions for many practical setting. The theoretical results are verified
with numerical experiments.
- Abstract(参考訳): ランダム特徴行列のスペクトルは、ランダム特徴回帰問題で使われる線形システムの条件付けに関する重要な情報を提供し、したがってランダム特徴モデルの一貫性と一般化に結びついている。
ランダム特徴行列は、データと重みの2つの入力変数に依存する非対称な非対称な非線形行列であり、特徴付けが困難である。
2つの入力変数の2つの設定について検討し、どちらも確率変数か確率変数で、もう1つは分離が良く、つまり点間の距離は最小である。
次元, 複雑性比, サンプリング分散の条件により, これらの行列の特異値は, 期待値の近傍に集中し, 確率の高い近傍に集中していることが示される。
特に、次元はランダムな重みの数の対数やデータポイントの数にのみ依存するため、我々の複雑性境界は多くの実用的な設定において適度な次元でも達成できる。
理論的結果は数値実験によって検証される。
関連論文リスト
- Two-Point Deterministic Equivalence for Stochastic Gradient Dynamics in Linear Models [76.52307406752556]
ランダムリゾルダーの2点関数に対する新しい決定論的等価性を導出する。
勾配勾配を有する多種多様な高次元学習線形モデルの性能を統一的に導出する。
論文 参考訳(メタデータ) (2025-02-07T16:45:40Z) - Invariant Kernels: Rank Stabilization and Generalization Across Dimensions [7.154556482351604]
対称性がカーネル行列のランクに顕著な影響を与えることを示す。
具体的には、その2つの引数に対して独立に作用する様々な群の下で不変な固定次数の核のランクを計算する。
上記の3つの例を含む具体的状況において、対称性はデータ次元から独立させるランクを劇的に減少させる。
論文 参考訳(メタデータ) (2025-02-03T23:37:43Z) - Low-Rank Matrix Factorizations with Volume-based Constraints and Regularizations [2.6687460222685226]
この論文は、解釈可能性と特異性を高めるために設計されたボリュームベースの制約と正規化に焦点を当てている。
ブラインドソース分離やデータ計算の欠如といったアプリケーションによって動機付けられたこの論文は、効率的なアルゴリズムも提案している。
論文 参考訳(メタデータ) (2024-12-09T10:58:23Z) - A class of 2 X 2 correlated random-matrix models with Brody spacing distribution [0.0]
ブロディ分布を固有値間隔分布とする 2 X 2 乱行列モデルのクラスを導入する。
ここで導入されたランダム行列は、ガウス直交アンサンブル(GOE)の3つの重要な方法で異なる。
論文 参考訳(メタデータ) (2023-08-03T03:11:54Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Numerical Solution of Stiff Ordinary Differential Equations with Random
Projection Neural Networks [0.0]
正規微分方程式(ODE)の解に対する乱射影ニューラルネットワーク(RPNN)に基づく数値スキームを提案する。
提案手法は剛性の影響を受けずに高い数値近似精度を示し,textttode45 と textttode15s の関数よりも優れていた。
論文 参考訳(メタデータ) (2021-08-03T15:49:17Z) - Spectral statistics for the difference of two Wishart matrices [1.2225709246035374]
2つの異なるアプローチを用いて有限次元シナリオにおける対応する固有値の結合確率密度関数を導出する。
これらの結果と、2つのランダム密度行列の差に対する対応する結果との関係を指摘し、スペクトル密度と絶対平均に対する明示的で閉じた式式を得る。
論文 参考訳(メタデータ) (2020-11-14T18:43:34Z) - Understanding Implicit Regularization in Over-Parameterized Single Index
Model [55.41685740015095]
我々は高次元単一インデックスモデルのための正規化自由アルゴリズムを設計する。
暗黙正則化現象の理論的保証を提供する。
論文 参考訳(メタデータ) (2020-07-16T13:27:47Z) - A Random Matrix Analysis of Random Fourier Features: Beyond the Gaussian
Kernel, a Precise Phase Transition, and the Corresponding Double Descent [85.77233010209368]
本稿では、データサンプルの数が$n$である現実的な環境で、ランダムフーリエ(RFF)回帰の正確さを特徴付けます。
この分析はまた、大きな$n,p,N$のトレーニングとテスト回帰エラーの正確な推定も提供する。
論文 参考訳(メタデータ) (2020-06-09T02:05:40Z) - Semiparametric Nonlinear Bipartite Graph Representation Learning with
Provable Guarantees [106.91654068632882]
半パラメトリック指数族分布におけるパラメータの統計的推定問題として、両部グラフを考察し、その表現学習問題を定式化する。
提案手法は, 地中真理付近で強い凸性を示すため, 勾配降下法が線形収束率を達成できることを示す。
我々の推定器は指数族内の任意のモデル誤特定に対して頑健であり、広範な実験で検証されている。
論文 参考訳(メタデータ) (2020-03-02T16:40:36Z) - Optimal Iterative Sketching with the Subsampled Randomized Hadamard
Transform [64.90148466525754]
最小二乗問題に対する反復スケッチの性能について検討する。
本研究では、Haar行列とランダム化されたHadamard行列の収束速度が同一であることを示し、ランダムなプロジェクションを経時的に改善することを示した。
これらの手法は、ランダム化次元還元を用いた他のアルゴリズムにも適用することができる。
論文 参考訳(メタデータ) (2020-02-03T16:17:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。