論文の概要: Bootstrapping the error of Oja's Algorithm
- arxiv url: http://arxiv.org/abs/2106.14857v1
- Date: Mon, 28 Jun 2021 17:27:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 19:00:43.936692
- Title: Bootstrapping the error of Oja's Algorithm
- Title(参考訳): Ojaのアルゴリズムのエラーをブートストラップする
- Authors: Robert Lunde, Purnamrita Sarkar, Rachel Ward
- Abstract要約: ストリーム主成分分析のためのOjaのアルゴリズムから,主固有ベクトルの推定誤差の不確かさを定量化する問題を考察する。
オンラインで更新できる乗算ブートストラップアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 16.017328736786922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of quantifying uncertainty for the estimation error
of the leading eigenvector from Oja's algorithm for streaming principal
component analysis, where the data are generated IID from some unknown
distribution. By combining classical tools from the U-statistics literature
with recent results on high-dimensional central limit theorems for quadratic
forms of random vectors and concentration of matrix products, we establish a
$\chi^2$ approximation result for the $\sin^2$ error between the population
eigenvector and the output of Oja's algorithm. Since estimating the covariance
matrix associated with the approximating distribution requires knowledge of
unknown model parameters, we propose a multiplier bootstrap algorithm that may
be updated in an online manner. We establish conditions under which the
bootstrap distribution is close to the corresponding sampling distribution with
high probability, thereby establishing the bootstrap as a consistent
inferential method in an appropriate asymptotic regime.
- Abstract(参考訳): 本稿では,Ojaのストリーム主成分分析アルゴリズムから先頭固有ベクトルの推定誤差を定量化する問題について考察する。
U-統計学の古典的ツールと、確率ベクトルの二次形式に対する高次元中心極限定理と行列積の集中に関する最近の結果を組み合わせることで、集団固有ベクトルとOjaのアルゴリズムの出力との誤差に対する$\chi^2$近似結果を確立する。
近似分布に付随する共分散行列を推定するには未知のモデルパラメータの知識が必要であるため,オンラインで更新できる乗算ブートストラップアルゴリズムを提案する。
我々は,ブートストラップ分布が対応するサンプリング分布に高い確率で近接する条件を確立し,ブートストラップを適切な漸近状態における一貫した推論方法として確立する。
関連論文リスト
- Distributional Matrix Completion via Nearest Neighbors in the Wasserstein Space [8.971989179518216]
わずかに観察された経験的分布の行列を考えると、観測された行列と観測されていない行列の両方に関連する真の分布をインプットしようと試みる。
最適輸送のツールを用いて、最も近い隣人法を分布設定に一般化する。
論文 参考訳(メタデータ) (2024-10-17T00:50:17Z) - Dynamical System Identification, Model Selection and Model Uncertainty Quantification by Bayesian Inference [0.8388591755871735]
本研究では,時系列データから動的システム同定を行うためのMAPフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-30T12:16:52Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Robust computation of optimal transport by $\beta$-potential
regularization [79.24513412588745]
最適輸送(OT)は、確率分布間の差を測定する機械学習分野で広く使われているツールである。
我々は、いわゆる$beta$-divergenceに付随するベータポテンシャル項でOTを正規化することを提案する。
提案アルゴリズムで計算した輸送行列は,外乱が存在する場合でも確率分布を頑健に推定するのに役立つことを実験的に実証した。
論文 参考訳(メタデータ) (2022-12-26T18:37:28Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - Trimmed Sampling Algorithm for the Noisy Generalized Eigenvalue Problem [0.0]
一般化固有値問題を解くことは、大きな量子系のエネルギー固有状態を見つけるのに有用な方法である。
マトリックス要素がメソッドを使って評価され、大きなエラーバーがある場合、特に問題となる。
本稿では,この問題を解決するためにトリミングサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-05T18:10:12Z) - Estimating Gaussian Copulas with Missing Data [0.0]
半パラメトリックなモデリングにより、境界面上の事前仮定を回避する方法を示す。
このアルゴリズムによって得られた共同分布は、既存の方法よりも基礎的な分布にかなり近い。
論文 参考訳(メタデータ) (2022-01-14T17:20:44Z) - Spectral clustering under degree heterogeneity: a case for the random
walk Laplacian [83.79286663107845]
本稿では,ランダムウォークラプラシアンを用いたグラフスペクトル埋め込みが,ノード次数に対して完全に補正されたベクトル表現を生成することを示す。
次数補正ブロックモデルの特別な場合、埋め込みはK個の異なる点に集中し、コミュニティを表す。
論文 参考訳(メタデータ) (2021-05-03T16:36:27Z) - Learning Minimax Estimators via Online Learning [55.92459567732491]
確率分布のパラメータを推定するミニマックス推定器を設計する際の問題点を考察する。
混合ケースナッシュ平衡を求めるアルゴリズムを構築した。
論文 参考訳(メタデータ) (2020-06-19T22:49:42Z) - Stochastic Saddle-Point Optimization for Wasserstein Barycenters [69.68068088508505]
オンラインデータストリームによって生成される有限個の点からなるランダムな確率測度に対する人口推定バリセンタ問題を考察する。
本稿では,この問題の構造を用いて,凸凹型サドル点再構成を行う。
ランダム確率測度の分布が離散的な場合、最適化アルゴリズムを提案し、その複雑性を推定する。
論文 参考訳(メタデータ) (2020-06-11T19:40:38Z) - Upper Bounds on the Generalization Error of Private Algorithms for
Discrete Data [31.122671977370416]
情報理論の観点からアルゴリズムの一般化能力について検討する。
特に、$epsilon$-DP および $mu$-GDP アルゴリズムの場合、この戦略で得られた限界を示す。
論文 参考訳(メタデータ) (2020-05-12T16:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。