論文の概要: Sparse PCA With Multiple Components
- arxiv url: http://arxiv.org/abs/2209.14790v1
- Date: Thu, 29 Sep 2022 13:57:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 17:04:15.673345
- Title: Sparse PCA With Multiple Components
- Title(参考訳): 複数のコンポーネントを持つスパースPCA
- Authors: Ryan Cory-Wright, Jean Pauphilet
- Abstract要約: スパース・プリンシパル・コンポーネント分析(Sparse principal Component Analysis)は、特徴の組み合わせ、または主成分(PC)を得る技術である。
中心となるのは、空間性や凸性に制約された凸問題の解決であり、計算的には非常に困難である。
本研究では,これらの緩和の厳密性を利用して,実世界のデータセットの1%-5%の順序で解を求めるための正確な方法と丸め機構を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sparse Principal Component Analysis is a cardinal technique for obtaining
combinations of features, or principal components (PCs), that explain the
variance of high-dimensional datasets in an interpretable manner. At its heart,
this involves solving a sparsity and orthogonality constrained convex
maximization problem, which is extremely computationally challenging. Most
existing work address sparse PCA via heuristics such as iteratively computing
one sparse PC and deflating the covariance matrix, which does not guarantee the
orthogonality, let alone the optimality, of the resulting solution. We
challenge this status by reformulating the orthogonality conditions as rank
constraints and optimizing over the sparsity and rank constraints
simultaneously. We design tight semidefinite relaxations and propose tractable
second-order cone versions of these relaxations which supply high-quality upper
bounds. We also design valid second-order cone inequalities which hold when
each PC's individual sparsity is specified, and demonstrate that these
inequalities tighten our relaxations significantly. Moreover, we propose exact
methods and rounding mechanisms that exploit these relaxations' tightness to
obtain solutions with a bound gap on the order of 1%-5% for real-world datasets
with p = 100s or 1000s of features and r \in {2, 3} components. We investigate
the performance of our methods in spiked covariance settings and demonstrate
that simultaneously considering the orthogonality and sparsity constraints
leads to improvements in the Area Under the ROC curve of 2%-8% compared to
state-of-the-art deflation methods. All in all, our approach solves sparse PCA
problems with multiple components to certifiable (near) optimality in a
practically tractable fashion.
- Abstract(参考訳): スパース主成分分析(英: sparse principal component analysis)は、高次元データセットの分散を解釈可能な方法で説明できる特徴と主成分(pcs)の組み合わせを得るための基数的手法である。
中心となるのは、空間性と直交性に制約のある凸最大化問題を解くことである。
既存の作業課題の多くは、1つのスパースPCを反復的に計算したり、共分散行列を縮めるようなヒューリスティックな手法によるスパースPCAである。
我々は,直交条件をランク制約として再構成し,スパルシリティとランク制約を同時に最適化することで,この状況に挑戦する。
我々は, 厳密な半有限緩和を設計し, 高品質な上界を提供する2階錐体版を提案する。
また,各pcの個々のスパース性が特定されたときに保持される有効な2次円錐不等式をデザインし,これらの不等式が我々の緩和を著しく強化することを示す。
さらに,p = 100 または 1000 個の特徴を持つ実世界のデータセットと r \in {2, 3} 成分に対して,1%-5% の有界ギャップを持つ解を得るために,これらの緩和の厳密性を利用する正確な方法と丸め機構を提案する。
提案手法の性能をスパイクされた共分散条件で検討し, 直交性および空間性制約を同時に考慮すると, ROC曲線の2%-8%の改善が得られたことを示す。
全体として、本手法は、複数のコンポーネントによるスパースPCA問題の解法であり、事実上の難解な方法で(ほぼ)最適性を証明できる。
関連論文リスト
- Variable Substitution and Bilinear Programming for Aligning Partially Overlapping Point Sets [48.1015832267945]
本研究では,RPMアルゴリズムの最小化目的関数を用いて要求を満たす手法を提案する。
分岐とバウンド(BnB)アルゴリズムが考案され、パラメータのみに分岐し、収束率を高める。
実験による評価は,非剛性変形,位置雑音,外れ値に対する提案手法の高剛性を示す。
論文 参考訳(メタデータ) (2024-05-14T13:28:57Z) - Empirical Bayes Covariance Decomposition, and a solution to the Multiple
Tuning Problem in Sparse PCA [2.5382095320488673]
スパース主成分分析(PCA)は,PCAの解釈可能性と信頼性を両立させる手法として提案されている。
経験ベイズ法による「複数チューニング問題」の解法を提案する。
論文 参考訳(メタデータ) (2023-12-06T04:00:42Z) - Stochastic Optimization for Non-convex Problem with Inexact Hessian
Matrix, Gradient, and Function [99.31457740916815]
信頼領域(TR)と立方体を用いた適応正則化は、非常に魅力的な理論的性質を持つことが証明されている。
TR法とARC法はヘッセン関数,勾配関数,関数値の非コンパクトな計算を同時に行うことができることを示す。
論文 参考訳(メタデータ) (2023-10-18T10:29:58Z) - Personalized PCA: Decoupling Shared and Unique Features [4.976703689624386]
異種データセットから共有特徴とユニークな特徴を分離するパーソナライズされたPCA(PerPCA)を提案する。
穏やかな条件下では、一意的特徴と共有的特徴の両方を制約付き最適化問題によって識別し、復元できることが示される。
異種データセットから共有とユニークな機能を分離するための体系的なアプローチとして、PerPCAは、ビデオセグメンテーション、トピック抽出、フィーチャークラスタリングなど、いくつかのタスクにおけるアプリケーションを見つける。
論文 参考訳(メタデータ) (2022-07-17T00:09:47Z) - Sparse PCA on fixed-rank matrices [0.05076419064097732]
共分散行列のランクが固定値であれば、大域的最適性に対してスパースPCAを解くアルゴリズムが存在することを示す。
また,主成分の非結合性を必要とするスパースPCAについても同様の結果が得られた。
論文 参考訳(メタデータ) (2022-01-07T15:05:32Z) - Sparse Quadratic Optimisation over the Stiefel Manifold with Application
to Permutation Synchronisation [71.27989298860481]
二次目的関数を最大化するスティーフェル多様体上の行列を求める非最適化問題に対処する。
そこで本研究では,支配的固有空間行列を求めるための,単純かつ効果的なスパーシティプロモーティングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-30T19:17:35Z) - Hybrid Trilinear and Bilinear Programming for Aligning Partially
Overlapping Point Sets [85.71360365315128]
多くの応用において、部分重なり合う点集合が対応するRPMアルゴリズムに不変であるようなアルゴリズムが必要である。
まず、目的が立方体有界関数であることを示し、次に、三線型および双線型単相変換の凸エンベロープを用いて、その下界を導出する。
次に、変換変数上の分岐のみを効率よく実行するブランチ・アンド・バウンド(BnB)アルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-01-19T04:24:23Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Exact and Approximation Algorithms for Sparse PCA [1.7640556247739623]
本稿では,MISDP(MISDP)とMISDP(MISDP)について述べる。
次に、それらの連続緩和値の理論的最適性ギャップを分析し、それらが最先端の値よりも強いことを証明する。
市販の解法は一般にMISDPを解くのが難しいため,MISDPと同等の大きさのMILP(mixed-integer linear program)を用いてSPCAを任意の精度で近似する。
論文 参考訳(メタデータ) (2020-08-28T02:07:08Z) - Conditional gradient methods for stochastically constrained convex
minimization [54.53786593679331]
構造凸最適化問題に対する条件勾配に基づく2つの新しい解法を提案する。
私たちのフレームワークの最も重要な特徴は、各イテレーションで制約のサブセットだけが処理されることです。
提案アルゴリズムは, 条件勾配のステップとともに, 分散の低減と平滑化に頼り, 厳密な収束保証を伴っている。
論文 参考訳(メタデータ) (2020-07-07T21:26:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。