論文の概要: D-GCCA: Decomposition-based Generalized Canonical Correlation Analysis
for Multi-view High-dimensional Data
- arxiv url: http://arxiv.org/abs/2001.02856v3
- Date: Fri, 16 Sep 2022 14:43:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 04:21:08.745581
- Title: D-GCCA: Decomposition-based Generalized Canonical Correlation Analysis
for Multi-view High-dimensional Data
- Title(参考訳): D-GCCA:多視点高次元データの分解に基づく一般化正準相関解析
- Authors: Hai Shu, Zhe Qu, Hongtu Zhu
- Abstract要約: 高次元多視点データ分析における一般的なモデルは、各ビューのデータ行列を、すべてのデータビューに共通する潜在因子によって生成される低ランクの共通ソース行列に分解する。
本稿では,分解に基づく一般化正準相関解析(D-GCCA)と呼ばれる新しい分解法を提案する。
我々のD-GCCAは、共通成分と特異成分を正準変数から分離することにより、一般化された正準相関解析よりも一歩前進する。
- 参考スコア(独自算出の注目度): 11.184915338554422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern biomedical studies often collect multi-view data, that is, multiple
types of data measured on the same set of objects. A popular model in
high-dimensional multi-view data analysis is to decompose each view's data
matrix into a low-rank common-source matrix generated by latent factors common
across all data views, a low-rank distinctive-source matrix corresponding to
each view, and an additive noise matrix. We propose a novel decomposition
method for this model, called decomposition-based generalized canonical
correlation analysis (D-GCCA). The D-GCCA rigorously defines the decomposition
on the L2 space of random variables in contrast to the Euclidean dot product
space used by most existing methods, thereby being able to provide the
estimation consistency for the low-rank matrix recovery. Moreover, to well
calibrate common latent factors, we impose a desirable orthogonality constraint
on distinctive latent factors. Existing methods, however, inadequately consider
such orthogonality and may thus suffer from substantial loss of undetected
common-source variation. Our D-GCCA takes one step further than generalized
canonical correlation analysis by separating common and distinctive components
among canonical variables, while enjoying an appealing interpretation from the
perspective of principal component analysis. Furthermore, we propose to use the
variable-level proportion of signal variance explained by common or distinctive
latent factors for selecting the variables most influenced. Consistent
estimators of our D-GCCA method are established with good finite-sample
numerical performance, and have closed-form expressions leading to efficient
computation especially for large-scale data. The superiority of D-GCCA over
state-of-the-art methods is also corroborated in simulations and real-world
data examples.
- Abstract(参考訳): 現代のバイオメディカル研究は、しばしば複数のビューデータ、すなわち同じオブジェクトの集合上で測定される複数のタイプのデータを収集する。
高次元多視点データ解析における一般的なモデルは、各ビューのデータマトリックスを、全データビューに共通する潜在要因、各ビューに対応する低ランク識別ソースマトリックス、付加ノイズマトリックスによって生成される低ランク共通ソースマトリックスに分解することである。
本稿では,分解に基づく一般化正準相関解析 (D-GCCA) と呼ばれる新しい分解法を提案する。
D-GCCAは、既存のほとんどの方法で用いられるユークリッドドット積空間とは対照的に、確率変数のL2空間の分解を厳格に定義し、低ランク行列回復のための推定整合性を提供することができる。
さらに,共通の潜在因子を適切に調整するために,固有潜在因子に対して望ましい直交性制約を課す。
しかし、既存の手法ではそのような直交性を十分に考慮していないため、検出されていない共通ソースのばらつきが著しく失われる可能性がある。
d-gccaは,標準変数間の共通成分と識別成分を分離し,主成分分析の観点から魅力的な解釈を享受することで,一般の標準相関解析よりも一歩進んだ。
さらに,最も影響の大きい変数を選択するために,共通要因や固有要因によって説明される信号分散の可変レベル比率を用いることを提案する。
D-GCCA法は, 有限サンプル数値特性が良好であり, 特に大規模データに対する効率的な計算に寄与するクローズドフォーム式を有する。
最先端手法よりもD-GCCAの方が優れていることはシミュレーションや実世界のデータ例でも裏付けられている。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - D-CDLF: Decomposition of Common and Distinctive Latent Factors for Multi-view High-dimensional Data [2.2481284426718533]
複数の高次元データビューの合同解析における典型的なアプローチは、各ビューのデータマトリックスを3つの部分に分解することである。
本稿では,2視点データに対する非相関性を効果的に実現するために,D-CDLF (Decomposition of Common and Distinctive Latent Factors) と呼ばれる新しい分解法を提案する。
論文 参考訳(メタデータ) (2024-06-30T15:38:38Z) - Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Simultaneous Dimensionality Reduction: A Data Efficient Approach for Multimodal Representations Learning [0.0]
次元性還元(DR):独立次元性還元(IDR)と同時次元性還元(SDR)の2つの主要クラスを探索する。
IDRでは、各モダリティは独立に圧縮され、可能な限り各モダリティに多くのばらつきを保持するよう努力する。
SDRでは、モダリティを同時に圧縮して、削減された記述間の共変を最大化し、個々の変動がどれだけ保存されているかに注意を払わない。
論文 参考訳(メタデータ) (2023-10-05T04:26:24Z) - Multiple Augmented Reduced Rank Regression for Pan-Cancer Analysis [0.0]
フレキシブルな行列回帰および分解法である多重強化階数回帰(maRRR)を提案する。
我々は、ランダム行列理論によって動機付けられた構造化された核ノルムの目的を考える。
われわれはTGAの複数の癌型(すなわち膵臓)の遺伝子発現データにmaRRRを適用した。
論文 参考訳(メタデータ) (2023-08-30T21:40:58Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z) - Multilinear Common Component Analysis via Kronecker Product
Representation [0.0]
複数のテンソルデータセットから共通構造を抽出する問題を考察する。
モードワイド共分散行列のKronecker積に基づく多線形共通成分分析(MCCA)を提案する。
我々は,モードワイドのグローバル収束を保証するMCCAの推定アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-09-06T10:03:17Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。