論文の概要: An Online Riemannian PCA for Stochastic Canonical Correlation Analysis
- arxiv url: http://arxiv.org/abs/2106.07479v1
- Date: Tue, 8 Jun 2021 23:38:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 17:34:42.224611
- Title: An Online Riemannian PCA for Stochastic Canonical Correlation Analysis
- Title(参考訳): 確率的正準相関解析のためのオンラインリーマンPCA
- Authors: Zihang Meng, Rudrasis Chakraborty, Vikas Singh
- Abstract要約: 投影行列の再パラメータ化を用いた正準相関解析(CCA)のための効率的なアルゴリズム(RSG+)を提案する。
本論文は,その特性の定式化と技術的解析に主眼を置いているが,本実験により,一般的なデータセットに対する経験的挙動が極めて有望であることが確認された。
- 参考スコア(独自算出の注目度): 37.8212762083567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an efficient stochastic algorithm (RSG+) for canonical correlation
analysis (CCA) using a reparametrization of the projection matrices. We show
how this reparametrization (into structured matrices), simple in hindsight,
directly presents an opportunity to repurpose/adjust mature techniques for
numerical optimization on Riemannian manifolds. Our developments nicely
complement existing methods for this problem which either require $O(d^3)$ time
complexity per iteration with $O(\frac{1}{\sqrt{t}})$ convergence rate (where
$d$ is the dimensionality) or only extract the top $1$ component with
$O(\frac{1}{t})$ convergence rate. In contrast, our algorithm offers a strict
improvement for this classical problem: it achieves $O(d^2k)$ runtime
complexity per iteration for extracting the top $k$ canonical components with
$O(\frac{1}{t})$ convergence rate. While the paper primarily focuses on the
formulation and technical analysis of its properties, our experiments show that
the empirical behavior on common datasets is quite promising. We also explore a
potential application in training fair models where the label of protected
attribute is missing or otherwise unavailable.
- Abstract(参考訳): 投影行列の再パラメータ化を用いた正準相関解析(CCA)のための効率的な確率的アルゴリズム(RSG+)を提案する。
この再パラメトリゼーション(into structured matrices, into structured matrices)を後から見れば、リーマン多様体上の数値最適化の手法を再利用・調整する機会を直接提示する。
当社の開発では,1イテレーションあたりの$o(d^3)$時間複雑性を$o(\frac{1}{\sqrt{t}})$収束率(ここで$d$は次元)で求めるか,あるいは$o(\frac{1}{t})$収束率でトップ$コンポーネントを抽出するか,という既存の手法をうまく補完しています。
対照的に、我々のアルゴリズムは、この古典的な問題に対して厳格に改善する:$O(d^2k)$実行時複雑性を達成し、$O(\frac{1}{t})$収束率で上位の$k$標準成分を抽出する。
本論文は,その特性の定式化と技術的解析に主眼を置いているが,本実験により,共通のデータセット上での経験的挙動が有望であることを示す。
また、保護属性のラベルが欠落している、あるいは利用できないフェアモデルのトレーニングにおける潜在的な応用についても検討する。
関連論文リスト
- Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs [56.237917407785545]
本稿では,円滑なベルマン作用素を持つ連続空間マルコフ決定過程(MDP)の一般クラスにおいて,$varepsilon$-optimal Policyを学習する問題を考察する。
我々のソリューションの鍵となるのは、調和解析のアイデアに基づく新しい射影技術である。
我々の結果は、連続空間 MDP における2つの人気と矛盾する視点のギャップを埋めるものである。
論文 参考訳(メタデータ) (2024-05-10T09:58:47Z) - Optimization without Retraction on the Random Generalized Stiefel Manifold [9.301728976515255]
本稿では,B$のランダムな推定値にのみアクセスしながら,最適化問題を解く,安価な反復手法を提案する。
我々の方法はすべての反復において制約を強制するのではなく、予想で定義される一般化されたスティーフェル多様体上の臨界点に収束する反復を生成する。
論文 参考訳(メタデータ) (2024-05-02T19:55:30Z) - Globally Convergent Accelerated Algorithms for Multilinear Sparse
Logistic Regression with $\ell_0$-constraints [2.323238724742687]
多重線形ロジスティック回帰は多次元データ解析の強力なツールである。
本稿では,$ell_0$-MLSRを解くために,アクセラレーションされた近位置換最小値MLSRモデルを提案する。
また、APALM$+$が一階臨界点に大域収束し、クルディ・ロジャシエヴィチ性質を用いて収束を確立することも示している。
論文 参考訳(メタデータ) (2023-09-17T11:05:08Z) - Efficiently Learning One-Hidden-Layer ReLU Networks via Schur
Polynomials [50.90125395570797]
正方形損失に関して、標準的なガウス分布の下での$k$ReLU活性化の線形結合をPAC学習する問題をmathbbRd$で検討する。
本研究の主な成果は,この学習課題に対して,サンプルおよび計算複雑性が$(dk/epsilon)O(k)$で,epsilon>0$が目標精度である。
論文 参考訳(メタデータ) (2023-07-24T14:37:22Z) - Replicable Clustering [57.19013971737493]
我々は,統計学的な$k$-medians,統計学的な$k$-means,統計学的な$k$-centers問題のアルゴリズムをブラックボックス方式で近似ルーチンを用いて提案する。
理論的結果を検証するブラックボックスとしてsklearnの$k$-means++実装を用いた2次元合成分布の実験も行っている。
論文 参考訳(メタデータ) (2023-02-20T23:29:43Z) - Private estimation algorithms for stochastic block models and mixture
models [63.07482515700984]
効率的なプライベート推定アルゴリズムを設計するための一般的なツール。
最初の効率的な$(epsilon, delta)$-differentially private algorithm for both weak recovery and exact recovery。
論文 参考訳(メタデータ) (2023-01-11T09:12:28Z) - Manifold Free Riemannian Optimization [4.484251538832438]
滑らかな多様体 $mathcalM$ を用いて最適化問題を解くための原理的枠組みを提案する。
代数学M におけるコスト関数 $(x_i, y_i) の雑音のないサンプル集合 mathbbR$ と多様体 $mathcalM$ の固有次元を用いる。
論文 参考訳(メタデータ) (2022-09-07T16:19:06Z) - Multi-block-Single-probe Variance Reduced Estimator for Coupled
Compositional Optimization [49.58290066287418]
構成問題の複雑さを軽減するために,MSVR (Multi-block-probe Variance Reduced) という新しい手法を提案する。
本研究の結果は, 試料の複雑さの順序や強靭性への依存など, 様々な面で先行して改善された。
論文 参考訳(メタデータ) (2022-07-18T12:03:26Z) - An Improved Analysis of Gradient Tracking for Decentralized Machine
Learning [34.144764431505486]
トレーニングデータが$n$エージェントに分散されるネットワーク上での分散機械学習を検討する。
エージェントの共通の目標は、すべての局所損失関数の平均を最小化するモデルを見つけることである。
ノイズのない場合、$p$を$mathcalO(p-1)$から$mathcalO(p-1)$に改善します。
論文 参考訳(メタデータ) (2022-02-08T12:58:14Z) - Clustering Mixture Models in Almost-Linear Time via List-Decodable Mean
Estimation [58.24280149662003]
本稿では,データセットの大部分を敵が破壊できるリストデコタブル平均推定の問題について検討する。
我々は、ほぼ最適な統計的保証を達成するために、リストデコダブル平均推定のための新しいアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-16T03:34:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。