論文の概要: Penalized Principal Component Analysis Using Smoothing
- arxiv url: http://arxiv.org/abs/2309.13838v2
- Date: Mon, 03 Mar 2025 01:47:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-04 13:03:25.364713
- Title: Penalized Principal Component Analysis Using Smoothing
- Title(参考訳): 平滑化を用いたペナル化主成分分析
- Authors: Rebecca M. Hurwitz, Georg Hahn,
- Abstract要約: PCAによって計算される主成分は、伝統的にゲノムデータの次元性を減らしたり、集団の成層化を補正するために用いられる。
本稿では、最適化問題として第一固有ベクトルの計算を再構成するペナル化固有値問題(PEP)について検討する。
- 参考スコア(独自算出の注目度): 0.9208007322096533
- License:
- Abstract: Principal components computed via PCA (principal component analysis) are traditionally used to reduce dimensionality in genomic data or to correct for population stratification. In this paper, we explore the penalized eigenvalue problem (PEP) which reformulates the computation of the first eigenvector as an optimization problem and adds an $L_1$ penalty constraint to enforce sparseness of the solution. The contribution of our article is threefold. First, we extend PEP by applying smoothing to the original LASSO-type $L_1$ penalty. This allows one to compute analytical gradients which enable faster and more efficient minimization of the objective function associated with the optimization problem. Second, we demonstrate how higher order eigenvectors can be calculated with PEP using established results from singular value decomposition (SVD). Third, we present four experimental studies to demonstrate the usefulness of the smoothed penalized eigenvectors. Using data from the 1000 Genomes Project dataset, we empirically demonstrate that our proposed smoothed PEP allows one to increase numerical stability and obtain meaningful eigenvectors. We also employ the penalized eigenvector approach in two additional real data applications (computation of a polygenic risk score and clustering), demonstrating that exchanging the penalized eigenvectors for their smoothed counterparts can increase prediction accuracy in polygenic risk scores and enhance discernibility of clusterings. Moreover, we compare our proposed smoothed PEP to seven state-of-the-art algorithms for sparse PCA and evaluate the accuracy of the obtained eigenvectors, their support recovery, and their runtime.
- Abstract(参考訳): PCA (Principal component analysis) によって計算される主成分は、伝統的にゲノムデータの次元性を減らしたり、集団の成層化を補正するために用いられる。
本稿では、最適化問題として第一固有ベクトルの計算を再構成し、解のスパース性を強制するために$L_1$のペナルティ制約を加える、ペナルティ付き固有値問題(PEP)について検討する。
私たちの記事の貢献は3倍です。
まず,元のLASSO型$L_1$ペナルティに平滑化を適用することにより,PEPを拡張した。
これにより、最適化問題に関連する目的関数のより高速で効率的な最小化を可能にする解析的勾配を計算することができる。
第2に、特異値分解(SVD)の確立された結果を用いて、PEPを用いて高次固有ベクトルをいかに計算できるかを示す。
第3に,円滑化ペナル化固有ベクトルの有用性を示すための4つの実験的検討を行った。
1000 Genomes Project データセットのデータを用いて,提案した滑らかな PEP が数値安定性を高め,有意義な固有ベクトルを得ることを可能にすることを実証的に実証した。
また,2つの実データアプリケーション(ポリジェニックリスクスコアの計算とクラスタリング)にペナル化固有ベクトルアプローチを適用し,そのスムーズなデータに対するペナル化固有ベクトルの交換により,ポリジェニックリスクスコアの予測精度が向上し,クラスタリングの識別性が向上することを示した。
さらに,提案したスムーズなPEPを,スパースPCAのための7つの最先端アルゴリズムと比較し,得られた固有ベクトルの精度,サポートリカバリ,ランタイムの評価を行った。
関連論文リスト
- Enhancing Blind Source Separation with Dissociative Principal Component Analysis [0.0]
疎主成分分析(sPCA)は、負荷ベクトル(LV)に間隔制約を課すことにより主成分(PC)の解釈可能性を高める
この制限を克服するために、sPCAの解釈可能性の優位性を保ちながら、ソース抽出能力を著しく向上する洗練されたアプローチを提案する。
このアルゴリズムは2つのアルゴリズムからなる: 解離型PCA (DPCA1 と DPCA2)。
論文 参考訳(メタデータ) (2024-11-19T08:24:01Z) - Efficient Estimation of Unique Components in Independent Component Analysis by Matrix Representation [1.0282274843007793]
独立成分分析(ICA)は信号処理や特徴抽出の様々な応用において広く用いられている手法である。
本稿では,アルゴリズムを行列表現で再構成することにより,ICAの固有推定を高度に高速化する。
人工データセットと脳波データを用いた実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-08-30T09:01:04Z) - Differentially Private Optimization with Sparse Gradients [60.853074897282625]
微分プライベート(DP)最適化問題を個人勾配の空間性の下で検討する。
これに基づいて、スパース勾配の凸最適化にほぼ最適な速度で純粋および近似DPアルゴリズムを得る。
論文 参考訳(メタデータ) (2024-04-16T20:01:10Z) - Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - PMaF: Deep Declarative Layers for Principal Matrix Features [37.662505982849844]
球面上の最小二乗(LESS)と暗黙の固有分解(IED)の2つの微分可能な深い宣言層を探索する。
LESSは、高次元行列から支配的な情報を含む低次元ベクトルでデータ特徴を表現するのに使うことができる。
IEDは、高次元行列から支配的な情報を含む低次元ベクトルでデータ特徴を表現するのに用いられる。
論文 参考訳(メタデータ) (2023-06-26T15:13:36Z) - Improved Privacy-Preserving PCA Using Optimized Homomorphic Matrix
Multiplication [0.0]
主成分分析(英: principal Component Analysis、PCA)は、機械学習とデータ分析の領域で広く利用されている重要な技術である。
近年,セキュアなクラウドコンピューティングシナリオにおいて,プライバシ保護型PCAアルゴリズムの同型暗号化を活用する取り組みが進められている。
本稿では,これらの制約に対処するプライバシー保護PCAに対して,従来の手法に比べて効率,精度,拡張性に優れる新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-27T02:51:20Z) - Exploring the Algorithm-Dependent Generalization of AUPRC Optimization
with List Stability [107.65337427333064]
AUPRC(Area Under the Precision-Recall Curve)の最適化は、機械学習にとって重要な問題である。
本研究では, AUPRC最適化の単依存一般化における最初の試行について述べる。
3つの画像検索データセットの実験は、我々のフレームワークの有効性と健全性に言及する。
論文 参考訳(メタデータ) (2022-09-27T09:06:37Z) - Entrywise Recovery Guarantees for Sparse PCA via Sparsistent Algorithms [9.112172220055431]
一般的な高次元のガウス設計の下で、スパースPCAに対して入出力$ell_2,infty$boundsを提供する。
提案手法は,確率の高い正しいサポートを選択するアルゴリズムであり,スパーシスタントなアルゴリズムである。
論文 参考訳(メタデータ) (2022-02-08T18:50:35Z) - AgFlow: Fast Model Selection of Penalized PCA via Implicit
Regularization Effects of Gradient Flow [64.81110234990888]
主成分分析(PCA)は特徴抽出と次元減少の有効な手法として広く用いられている。
High Dimension Low Sample Size (HDLSS) 設定では、ペナル化ロードを備えた修正主成分が好まれる。
ペナル化PCAの高速モデル選択法として近似勾配流(AgFlow)を提案する。
論文 参考訳(メタデータ) (2021-10-07T08:57:46Z) - Robust Differentiable SVD [117.35644933471401]
対称行列の固有分解は多くのコンピュータビジョンアルゴリズムの中心にある。
不安定性は互いに近い固有値の存在によって生じる。
SVD勾配のテイラー展開は、反復過程に依存することなくPIを用いて得られる勾配と理論的に等価であることを示す。
論文 参考訳(メタデータ) (2021-04-08T15:04:15Z) - On the Convergence Rate of Projected Gradient Descent for a
Back-Projection based Objective [58.33065918353532]
我々は、最小二乗(LS)の代替として、バックプロジェクションに基づく忠実度項を考える。
LS項ではなくBP項を用いることで最適化アルゴリズムの繰り返しを少なくすることを示す。
論文 参考訳(メタデータ) (2020-05-03T00:58:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。