論文の概要: Empirical Bayes PCA in high dimensions
- arxiv url: http://arxiv.org/abs/2012.11676v1
- Date: Mon, 21 Dec 2020 20:43:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 06:20:41.512947
- Title: Empirical Bayes PCA in high dimensions
- Title(参考訳): 高次元における経験的ベイズPCA
- Authors: Xinyi Zhong and Chang Su and Zhou Fan
- Abstract要約: 主成分分析は高次元雑音の異常な現象を示すことが知られている。
主成分の結合分布に対する構造的事前を推定することにより,このノイズを低減できる経験的ベイズPCA法を提案する。
- 参考スコア(独自算出の注目度): 11.806200054814772
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When the dimension of data is comparable to or larger than the number of
available data samples, Principal Components Analysis (PCA) is known to exhibit
problematic phenomena of high-dimensional noise. In this work, we propose an
Empirical Bayes PCA method that reduces this noise by estimating a structural
prior for the joint distributions of the principal components. This EB-PCA
method is based upon the classical Kiefer-Wolfowitz nonparametric MLE for
empirical Bayes estimation, distributional results derived from random matrix
theory for the sample PCs, and iterative refinement using an Approximate
Message Passing (AMP) algorithm. In theoretical "spiked" models, EB-PCA
achieves Bayes-optimal estimation accuracy in the same settings as the oracle
Bayes AMP procedure that knows the true priors. Empirically, EB-PCA can
substantially improve over PCA when there is strong prior structure, both in
simulation and on several quantitative benchmarks constructed using data from
the 1000 Genomes Project and the International HapMap Project. A final
illustration is presented for an analysis of gene expression data obtained by
single-cell RNA-seq.
- Abstract(参考訳): データの次元が利用可能なデータサンプルの数と同等かそれ以上である場合、主成分分析(PCA)は高次元ノイズの異常な現象を示すことが知られている。
本研究では,主成分の結合分布に先行する構造を推定することにより,このノイズを低減できる経験的ベイズPCA法を提案する。
このEB-PCA法は,経験的ベイズ推定のための古典的キーファー・ウルフウィッツ非パラメトリックMLE,サンプルPCのランダム行列理論から導かれた分布結果,および近似メッセージパッシング(AMP)アルゴリズムによる反復的改善に基づいている。
理論的「スパイクされた」モデルでは、EB-PCAは、真の事前を知っているオラクルAMP手順と同じ設定でベイズ最適推定精度を達成する。
EB-PCAは、シミュレーションと1000 Genomes ProjectとInternational HapMap Projectのデータを用いて構築された数種類の定量的ベンチマークの両方において、強い事前構造が存在する場合、PCAよりも大幅に改善できる。
単細胞RNA-seqで得られた遺伝子発現データの解析のための最終図表を提示する。
関連論文リスト
- Poisson Process for Bayesian Optimization [126.51200593377739]
本稿では、Poissonプロセスに基づくランキングベースの代理モデルを提案し、Poisson Process Bayesian Optimization(PoPBO)と呼ばれる効率的なBOフレームワークを提案する。
従来のGP-BO法と比較すると,PoPBOはコストが低く,騒音に対する堅牢性も良好であり,十分な実験により検証できる。
論文 参考訳(メタデータ) (2024-02-05T02:54:50Z) - Sparse PCA with Oracle Property [115.72363972222622]
新規な正規化を伴うスパースPCAの半定緩和に基づく推定器群を提案する。
我々は、家族内の別の推定器が、スパースPCAの標準半定緩和よりも、より急激な収束率を達成することを証明した。
論文 参考訳(メタデータ) (2023-12-28T02:52:54Z) - HeMPPCAT: Mixtures of Probabilistic Principal Component Analysers for
Data with Heteroscedastic Noise [28.24679019484073]
MPPCAは、各混合物のデータサンプルがホモシステマティックノイズを含むと仮定する。
MPPCAの性能は、サンプル間での異方性雑音を伴うデータに対して最適である。
本稿では,一般化予測最大化(GEM)アルゴリズムを用いた確率的PCA手法(HeMPPCAT)のヘテロ代用混合物を提案する。
論文 参考訳(メタデータ) (2023-01-21T02:00:55Z) - Bayes-optimal limits in structured PCA, and how to reach them [21.3083877172595]
本研究では,主成分分析(PCA)のパラダイム行列モデルについて検討し,次数1の行列が付加雑音によって劣化することを示した。
このモデルにおいて、ベイズ-最適推論の極限を初めて特徴づける。
本稿では、適応的Thouless-Anderson-Palmer方程式の理論に着想を得た、新しい近似メッセージパッシングアルゴリズム(AMP)を提案する。
論文 参考訳(メタデータ) (2022-10-03T21:31:41Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Robust Quantitative Susceptibility Mapping via Approximate Message
Passing with Parameter Estimation [14.22930572798757]
本稿では,パラメータ推定を組み込んだ定量的感受性マッピング(QSM)の確率的ベイズ的手法を提案する。
Sim2Snr1データセットでは、AMP-PEは最低のNRMSE、DFCM、最高のSSIMを達成した。
生体内データセットでは、AMP-PEは頑健であり、推定パラメータを用いて感受性マップの復元に成功した。
論文 参考訳(メタデータ) (2022-07-29T14:38:03Z) - Probabilistic Conformal Prediction Using Conditional Random Samples [73.26753677005331]
PCPは、不連続な予測セットによって対象変数を推定する予測推論アルゴリズムである。
効率的で、明示的または暗黙的な条件生成モデルと互換性がある。
論文 参考訳(メタデータ) (2022-06-14T03:58:03Z) - PCA Initialization for Approximate Message Passing in Rotationally
Invariant Models [29.039655256171088]
主成分分析は自然推定器であり、その性能は高次元状態において急激な結果が得られた。
近年,PCAの精度を向上させる可能性のある代替推定器として,AMPアルゴリズムが提案されている。
そこで本研究では,AMPをPCAに初期化する2つの手法を組み合わせて,この推定器の性能を厳密に評価する手法を提案する。
論文 参考訳(メタデータ) (2021-06-04T09:13:51Z) - Statistical Approach to Quantum Phase Estimation [62.92678804023415]
位相推定アルゴリズム(PEA)に新しい統計的・変動的アプローチを導入する。
固有位相推定のみを返す従来的かつ反復的なPEAとは異なり、提案手法は未知の固有状態-固有位相対を決定できる。
本稿では,IBM Qプラットフォームおよびローカルコンピュータ上で,Qiskitパッケージを用いた手法のシミュレーション結果を示す。
論文 参考訳(メタデータ) (2021-04-21T00:02:00Z) - Improved Dimensionality Reduction of various Datasets using Novel
Multiplicative Factoring Principal Component Analysis (MPCA) [0.0]
本稿では,従来のPCA手法である乗算因子分解主成分分析の改良について述べる。
従来のPCAに対するMPCAの利点は、乗算器を通して発生空間にペナルティを課すことで、射影の探索において、アウトレーヤの効果を無視できることである。
論文 参考訳(メタデータ) (2020-09-25T12:30:15Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。