論文の概要: Probabilistic Contrastive Principal Component Analysis
- arxiv url: http://arxiv.org/abs/2012.07977v2
- Date: Fri, 30 Apr 2021 22:53:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 14:14:34.135097
- Title: Probabilistic Contrastive Principal Component Analysis
- Title(参考訳): 確率的対比主成分分析
- Authors: Didong Li, Andrew Jones and Barbara Engelhardt
- Abstract要約: 比較主成分分析(CPCA)のモデルに基づく代替案を提案する。
CPCAに対するPCPCAのアドバンテージは、解釈性の向上、不確実性定量化、原理推論などである。
遺伝子発現、タンパク質発現、画像のデータセットを用いた一連のシミュレーションとケースコントロール実験によりPCPCAの性能を実証します。
- 参考スコア(独自算出の注目度): 0.5286651840245514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dimension reduction is useful for exploratory data analysis. In many
applications, it is of interest to discover variation that is enriched in a
"foreground" dataset relative to a "background" dataset. Recently, contrastive
principal component analysis (CPCA) was proposed for this setting. However, the
lack of a formal probabilistic model makes it difficult to reason about CPCA
and to tune its hyperparameter. In this work, we propose probabilistic
contrastive principal component analysis (PCPCA), a model-based alternative to
CPCA. We discuss how to set the hyperparameter in theory and in practice, and
we show several of PCPCA's advantages over CPCA, including greater
interpretability, uncertainty quantification and principled inference,
robustness to noise and missing data, and the ability to generate data from the
model. We demonstrate PCPCA's performance through a series of simulations and
case-control experiments with datasets of gene expression, protein expression,
and images.
- Abstract(参考訳): 次元減少は探索データ解析に有用である。
多くのアプリケーションにおいて、"背景"データセットに対して"背景"データセットに富んだバリエーションを見つけることが興味がある。
近年, コントラスト主成分分析 (CPCA) が提案されている。
しかし、形式的確率モデルがないため、CPCAについて推論し、ハイパーパラメータを調整することは困難である。
本研究では,CPCAのモデルに基づく代替品であるPCPCA(probabilistic contrastive principal component analysis)を提案する。
理論および実際においてハイパーパラメータの設定方法について議論し,cpcaに対するpcpcaのアドバンテージとして,解釈性の向上,不確実性定量化と原理推論,ノイズと欠落データに対する頑健性,モデルからデータを生成する能力などを示す。
遺伝子発現,タンパク質発現,画像のデータセットを用いた一連のシミュレーションおよびケースコントロール実験を通じてpcpcaの性能を実証する。
関連論文リスト
- ALPCAH: Sample-wise Heteroscedastic PCA with Tail Singular Value
Regularization [17.771454131646312]
主成分分析はデータ次元削減の分野で重要なツールである。
そこで本研究では,サンプル単位の雑音分散を推定できるPCA法を開発した。
これは低ランク成分の分布的な仮定なしで、ノイズの分散が知られていると仮定せずに行われる。
論文 参考訳(メタデータ) (2023-07-06T03:11:11Z) - PLPCA: Persistent Laplacian Enhanced-PCA for Microarray Data Analysis [5.992724190105578]
永続ラプラシアン強化主成分分析(PLPCA)を提案する。
PLPCAは、パーシステンシャルスペクトルグラフ理論を用いた初期の正規化PCA法の利点を生かしている。
グラフラプラシアンとは対照的に、永続ラプラシアンは濾過によるマルチスケール解析を可能にし、高次単純錯体を包含する。
論文 参考訳(メタデータ) (2023-06-09T22:48:14Z) - An online algorithm for contrastive Principal Component Analysis [9.090031210111919]
我々は、cPCA*のオンラインアルゴリズムを導き、局所的な学習規則でニューラルネットワークにマップできることを示し、エネルギー効率の良いニューロモルフィックハードウェアで実装できる可能性がある。
実際のデータセット上でのオンラインアルゴリズムの性能を評価し、元の定式化との相違点と類似点を強調した。
論文 参考訳(メタデータ) (2022-11-14T19:48:48Z) - coVariance Neural Networks [119.45320143101381]
グラフニューラルネットワーク(GNN)は、グラフ構造化データ内の相互関係を利用して学習する効果的なフレームワークである。
我々は、サンプル共分散行列をグラフとして扱う、共分散ニューラルネットワーク(VNN)と呼ばれるGNNアーキテクチャを提案する。
VNN の性能は PCA ベースの統計手法よりも安定していることを示す。
論文 参考訳(メタデータ) (2022-05-31T15:04:43Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - Capturing patterns of variation unique to a specific dataset [68.8204255655161]
対象データセットの1つ以上の比較データセットに対する低次元表現を同定するチューニングフリー手法を提案する。
複数の実験で、単一のバックグラウンドデータセットを持つUCAが、様々なチューニングパラメータを持つcPCAと同じような結果を達成することを示しました。
論文 参考訳(メタデータ) (2021-04-16T15:07:32Z) - Enhanced Principal Component Analysis under A Collaborative-Robust
Framework [89.28334359066258]
重み学習とロバストな損失を非自明な方法で組み合わせる,一般的な協調ロバスト重み学習フレームワークを提案する。
提案されたフレームワークでは、トレーニング中の重要度を示す適切なサンプルの一部のみがアクティブになり、エラーが大きい他のサンプルは無視されません。
特に、不活性化試料の負の効果はロバスト損失関数によって軽減される。
論文 参考訳(メタデータ) (2021-03-22T15:17:37Z) - Probabilistic Generating Circuits [50.98473654244851]
効率的な表現のための確率的生成回路(PGC)を提案する。
PGCは、非常に異なる既存モデルを統一する理論的なフレームワークであるだけでなく、現実的なデータをモデル化する大きな可能性も示している。
我々はPCとDPPの単純な組み合わせによって簡単に仮定されない単純なPGCのクラスを示し、一連の密度推定ベンチマークで競合性能を得る。
論文 参考訳(メタデータ) (2021-02-19T07:06:53Z) - Supervised PCA: A Multiobjective Approach [70.99924195791532]
制御主成分分析法(SPCA)
本研究では,これらの目的を両立させる新しいSPCA手法を提案する。
この手法は、任意の教師付き学習損失に対応し、統計的再構成により、一般化された線形モデルの新しい低ランク拡張を提供する。
論文 参考訳(メタデータ) (2020-11-10T18:46:58Z) - Principal Ellipsoid Analysis (PEA): Efficient non-linear dimension
reduction & clustering [9.042239247913642]
本稿では,データとより柔軟なクラスタ形状の非線形関係を実現することにより,PCAとk平均の改善に焦点を当てる。
鍵となる貢献は、PCAに代わる単純で効率的な代替品を定義する、PEA(Principal Analysis)の新しいフレームワークである。
さまざまな実際のデータクラスタリングアプリケーションにおいて、PEAは単純なデータセットのためのk-meansと同様に機能し、より複雑な設定でパフォーマンスを劇的に改善する。
論文 参考訳(メタデータ) (2020-08-17T06:25:50Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。