論文の概要: Streaming PCA for Markovian Data
- arxiv url: http://arxiv.org/abs/2305.02456v1
- Date: Wed, 3 May 2023 22:56:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 17:48:05.279604
- Title: Streaming PCA for Markovian Data
- Title(参考訳): マルコフデータのストリーミングPCA
- Authors: Syamantak Kumar and Purnamrita Sarkar
- Abstract要約: Ojaのアルゴリズムは、ストリーミング原理コンポーネント分析の確立された方法となっている。
そこで本研究では,データポイントが既約,非周期,マルコフ連鎖からサンプリングされるPCAのストリーミング問題について検討する。
我々はOjaのアルゴリズムをデータ全体に対して最初のシャープレートで取得し、データを捨てることによって生じる$n$の対数依存を除去する。
- 参考スコア(独自算出の注目度): 14.620086904601472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since its inception in Erikki Oja's seminal paper in 1982, Oja's algorithm
has become an established method for streaming principle component analysis
(PCA). We study the problem of streaming PCA, where the data-points are sampled
from an irreducible, aperiodic, and reversible Markov chain. Our goal is to
estimate the top eigenvector of the unknown covariance matrix of the stationary
distribution. This setting has implications in situations where data can only
be sampled from a Markov Chain Monte Carlo (MCMC) type algorithm, and the goal
is to do inference for parameters of the stationary distribution of this chain.
Most convergence guarantees for Oja's algorithm in the literature assume that
the data-points are sampled IID. For data streams with Markovian dependence,
one typically downsamples the data to get a "nearly" independent data stream.
In this paper, we obtain the first sharp rate for Oja's algorithm on the entire
data, where we remove the logarithmic dependence on $n$ resulting from throwing
data away in downsampling strategies.
- Abstract(参考訳): 1982年にErikki Ojaのセミナー論文に登場して以来、Ojaのアルゴリズムはストリーミング原理成分分析(PCA)の確立された方法となっている。
本研究では,データポイントを既約,非周期,可逆マルコフ連鎖からサンプリングするストリーミングpcaの問題について検討する。
我々の目標は定常分布の未知共分散行列の最上位固有ベクトルを推定することである。
この設定は、マルコフ連鎖モンテカルロ(mcmc)型アルゴリズムからのみデータをサンプリングできる状況において意味を持ち、この連鎖の定常分布のパラメータの推測を行うことが目的である。
文献におけるOjaのアルゴリズムのほとんどの収束保証は、データポイントがIIDのサンプルであると仮定する。
マルコフ依存のデータストリームの場合、典型的にはデータをダウンサンプリングして"ほぼ"独立したデータストリームを得る。
本稿では,データ全体に対するojaアルゴリズムの最初のシャープレートを得るとともに,ダウンサンプリング戦略でデータを捨てることから,n$ に対する対数依存を取り除いた。
関連論文リスト
- Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Revisiting Rotation Averaging: Uncertainties and Robust Losses [51.64986160468128]
現在の手法の主な問題は、推定エピポーラを通して入力データと弱い結合しか持たない最小コスト関数である。
本稿では,点対応から回転平均化への不確実性を直接伝播させることにより,基礎となる雑音分布をモデル化することを提案する。
論文 参考訳(メタデータ) (2023-03-09T11:51:20Z) - Langevin Monte Carlo for Contextual Bandits [72.00524614312002]
Langevin Monte Carlo Thompson Sampling (LMC-TS) が提案されている。
提案アルゴリズムは,文脈的帯域幅の特別な場合において,最高のトンプソンサンプリングアルゴリズムと同じサブ線形残差を達成できることを示す。
論文 参考訳(メタデータ) (2022-06-22T17:58:23Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - A Linearly Convergent Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
本稿では,1時間スケール分散pcaアルゴリズムである分散sanger's algorithm(dsa)を提案する。
提案アルゴリズムは真の解の近傍に線形収束することを示した。
論文 参考訳(メタデータ) (2021-01-05T00:51:14Z) - More Informed Random Sample Consensus [1.827510863075184]
本稿では,L'evy分布とデータソートアルゴリズムを併用してデータをサンプリングする手法を提案する。
提案手法の仮説サンプリングステップでは, データをソートアルゴリズムでソートし, 不整集合にあるデータ点の確率に基づいてデータをソートする。
次に、L'evy分布のソートされたデータから仮説をサンプリングする。
論文 参考訳(メタデータ) (2020-11-18T06:43:50Z) - A Method for Handling Multi-class Imbalanced Data by Geometry based
Information Sampling and Class Prioritized Synthetic Data Generation (GICaPS) [15.433936272310952]
本稿では,多ラベル分類問題における不均衡データ処理の問題について考察する。
特徴ベクトル間の幾何学的関係を利用する2つの新しい手法が提案されている。
提案手法の有効性は,汎用的なマルチクラス認識問題を解くことによって解析する。
論文 参考訳(メタデータ) (2020-10-11T04:04:26Z) - The Boomerang Sampler [4.588028371034406]
本稿では, 連続時間非可逆マルコフ連鎖モンテカルロアルゴリズムの新たなクラスとして, ブーメラン・サンプラーを導入する。
提案手法は実装が容易であることを実証し,既存のベンチマークを断片的決定論的マルコフプロセスより優れていることを示す。
論文 参考訳(メタデータ) (2020-06-24T14:52:22Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - Nonparametric Bayesian volatility learning under microstructure noise [2.812395851874055]
市場マイクロ構造騒音下でのボラティリティ学習の課題について検討する。
具体的には、微分方程式からノイズの多い離散時間観測を考察する。
方程式の拡散係数を学習するための新しい計算法を開発した。
論文 参考訳(メタデータ) (2018-05-15T07:32:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。