論文の概要: Streaming PCA for Markovian Data
- arxiv url: http://arxiv.org/abs/2305.02456v2
- Date: Fri, 16 Jun 2023 21:31:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 02:30:59.804448
- Title: Streaming PCA for Markovian Data
- Title(参考訳): マルコフデータのストリーミングPCA
- Authors: Syamantak Kumar and Purnamrita Sarkar
- Abstract要約: Ojaのアルゴリズムはストリーミング原理成分分析(PCA)の確立された方法となった
そこで本研究では,データポイントが既約,周期的,可逆的なマルコフ連鎖からサンプリングされるPCAのストリーミング問題について検討する。
我々はOjaのアルゴリズムの最初のシャープレートをデータ全体に対して取得し、サンプルサイズに対する対数依存を除去する。
- 参考スコア(独自算出の注目度): 14.620086904601472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since its inception in 1982, Oja's algorithm has become an established method
for streaming principle component analysis (PCA). We study the problem of
streaming PCA, where the data-points are sampled from an irreducible,
aperiodic, and reversible Markov chain. Our goal is to estimate the top
eigenvector of the unknown covariance matrix of the stationary distribution.
This setting has implications in scenarios where data can solely be sampled
from a Markov Chain Monte Carlo (MCMC) type algorithm, and the objective is to
perform inference on parameters of the stationary distribution. Most
convergence guarantees for Oja's algorithm in the literature assume that the
data-points are sampled IID. For data streams with Markovian dependence, one
typically downsamples the data to get a "nearly" independent data stream. In
this paper, we obtain the first sharp rate for Oja's algorithm on the entire
data, where we remove the logarithmic dependence on the sample size, $n$,
resulting from throwing data away in downsampling strategies.
- Abstract(参考訳): 1982年の開始以来、Ojaのアルゴリズムはストリーミング原理成分分析(PCA)の確立された方法となっている。
本研究では,データポイントを既約,非周期,可逆マルコフ連鎖からサンプリングするストリーミングpcaの問題について検討する。
我々の目標は定常分布の未知共分散行列の最上位固有ベクトルを推定することである。
この設定は、マルコフ連鎖モンテカルロ(mcmc)型アルゴリズムからのみデータをサンプリングできるシナリオにおいて意味を持ち、定常分布のパラメータの推論を行うことが目的である。
文献におけるOjaのアルゴリズムのほとんどの収束保証は、データポイントがIIDのサンプルであると仮定する。
マルコフ依存のデータストリームの場合、典型的にはデータをダウンサンプリングして"ほぼ"独立したデータストリームを得る。
本稿では,ojaアルゴリズムのサンプルサイズに対する対数依存を除去し,ダウンサンプリング戦略からデータを捨てることにより,ojaアルゴリズムに対する最初の鋭利率を求める。
関連論文リスト
- Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2436697657307]
予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-06-06T17:37:39Z) - Revisiting Rotation Averaging: Uncertainties and Robust Losses [51.64986160468128]
現在の手法の主な問題は、推定エピポーラを通して入力データと弱い結合しか持たない最小コスト関数である。
本稿では,点対応から回転平均化への不確実性を直接伝播させることにより,基礎となる雑音分布をモデル化することを提案する。
論文 参考訳(メタデータ) (2023-03-09T11:51:20Z) - Langevin Monte Carlo for Contextual Bandits [72.00524614312002]
Langevin Monte Carlo Thompson Sampling (LMC-TS) が提案されている。
提案アルゴリズムは,文脈的帯域幅の特別な場合において,最高のトンプソンサンプリングアルゴリズムと同じサブ線形残差を達成できることを示す。
論文 参考訳(メタデータ) (2022-06-22T17:58:23Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Noise-Resistant Deep Metric Learning with Probabilistic Instance
Filtering [59.286567680389766]
ノイズラベルは現実世界のデータによく見られ、ディープニューラルネットワークの性能劣化を引き起こす。
DMLのための確率的ランク付けに基づくメモリを用いたインスタンス選択(PRISM)手法を提案する。
PRISMはラベルがクリーンである確率を計算し、潜在的にノイズの多いサンプルをフィルタリングする。
論文 参考訳(メタデータ) (2021-08-03T12:15:25Z) - A Linearly Convergent Algorithm for Distributed Principal Component
Analysis [12.91948651812873]
本稿では,1時間スケール分散pcaアルゴリズムである分散sanger's algorithm(dsa)を提案する。
提案アルゴリズムは真の解の近傍に線形収束することを示した。
論文 参考訳(メタデータ) (2021-01-05T00:51:14Z) - More Informed Random Sample Consensus [1.827510863075184]
本稿では,L'evy分布とデータソートアルゴリズムを併用してデータをサンプリングする手法を提案する。
提案手法の仮説サンプリングステップでは, データをソートアルゴリズムでソートし, 不整集合にあるデータ点の確率に基づいてデータをソートする。
次に、L'evy分布のソートされたデータから仮説をサンプリングする。
論文 参考訳(メタデータ) (2020-11-18T06:43:50Z) - A Method for Handling Multi-class Imbalanced Data by Geometry based
Information Sampling and Class Prioritized Synthetic Data Generation (GICaPS) [15.433936272310952]
本稿では,多ラベル分類問題における不均衡データ処理の問題について考察する。
特徴ベクトル間の幾何学的関係を利用する2つの新しい手法が提案されている。
提案手法の有効性は,汎用的なマルチクラス認識問題を解くことによって解析する。
論文 参考訳(メタデータ) (2020-10-11T04:04:26Z) - The Boomerang Sampler [4.588028371034406]
本稿では, 連続時間非可逆マルコフ連鎖モンテカルロアルゴリズムの新たなクラスとして, ブーメラン・サンプラーを導入する。
提案手法は実装が容易であることを実証し,既存のベンチマークを断片的決定論的マルコフプロセスより優れていることを示す。
論文 参考訳(メタデータ) (2020-06-24T14:52:22Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - Nonparametric Bayesian volatility learning under microstructure noise [2.812395851874055]
市場マイクロ構造騒音下でのボラティリティ学習の課題について検討する。
具体的には、微分方程式からノイズの多い離散時間観測を考察する。
方程式の拡散係数を学習するための新しい計算法を開発した。
論文 参考訳(メタデータ) (2018-05-15T07:32:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。