論文の概要: Grouping effects of sparse CCA models in variable selection
- arxiv url: http://arxiv.org/abs/2008.03392v1
- Date: Fri, 7 Aug 2020 22:27:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 01:55:56.279877
- Title: Grouping effects of sparse CCA models in variable selection
- Title(参考訳): 可変選択におけるスパースCCAモデルの群化効果
- Authors: Kefei Liu, Qi Long, Li Shen
- Abstract要約: 可変選択における標準および単純化されたSCCAモデルのグルーピング効果を解析する。
我々の理論的分析は、群付き変数選択の場合、単純化されたSCCAが一緒に変数群を選択または選択することを示している。
- 参考スコア(独自算出の注目度): 6.196334136139173
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The sparse canonical correlation analysis (SCCA) is a bi-multivariate
association model that finds sparse linear combinations of two sets of
variables that are maximally correlated with each other. In addition to the
standard SCCA model, a simplified SCCA criterion which maixmizes the
cross-covariance between a pair of canonical variables instead of their
cross-correlation, is widely used in the literature due to its computational
simplicity. However, the behaviors/properties of the solutions of these two
models remain unknown in theory. In this paper, we analyze the grouping effect
of the standard and simplified SCCA models in variable selection. In
high-dimensional settings, the variables often form groups with high
within-group correlation and low between-group correlation. Our theoretical
analysis shows that for grouped variable selection, the simplified SCCA jointly
selects or deselects a group of variables together, while the standard SCCA
randomly selects a few dominant variables from each relevant group of
correlated variables. Empirical results on synthetic data and real imaging
genetics data verify the finding of our theoretical analysis.
- Abstract(参考訳): スパース正準相関解析(sparse canonical correlation analysis, SCCA)は、最大相関を持つ2つの変数のスパース線形結合を求める二変数相関モデルである。
標準のSCCAモデルに加えて、一対の正準変数間の相互共分散を近似する単純化されたSCCA基準が、計算の単純さから文献で広く使われている。
しかし、これらの2つのモデルの解の挙動や性質は理論上不明である。
本稿では,可変選択における標準および単純化されたSCCAモデルのグルーピング効果を解析する。
高次元設定では、変数は高いグループ内相関と低いグループ間相関を持つグループを形成することが多い。
我々の理論分析では, 単純化されたSCCAは変数群を共に選択または選択し, 標準のSCCAは関連変数群からいくつかの支配変数をランダムに選択する。
合成データおよび実画像遺伝データを用いた実験結果から, 理論的解析結果が得られた。
関連論文リスト
- HiPerformer: Hierarchically Permutation-Equivariant Transformer for Time
Series Forecasting [56.95572957863576]
本稿では,同じ群を構成する成分間の関係と群間の関係を考察した階層的置換同変モデルを提案する。
実世界のデータを用いた実験により,提案手法が既存の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-05-14T05:11:52Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - Conditional canonical correlation estimation based on covariates with
random forests [0.0]
本研究では,2つの変数間の条件付き正準相関を推定するRFCCAを用いたランダムフォレスト(Random Forest)を提案する。
提案手法と大域的意義試験は,精度の高い正準相関推定とよく制御されたType-1誤差を提供するシミュレーション研究によって評価される。
論文 参考訳(メタデータ) (2020-11-23T17:09:46Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - $\ell_0$-based Sparse Canonical Correlation Analysis [7.073210405344709]
正準相関解析(CCA)モデルは、2つの変数の集合間の関連を研究する上で強力である。
その成功にもかかわらず、CCAモデルは、いずれかのモダリティにおける変数数がサンプル数を超えた場合、壊れる可能性がある。
本稿では,2つのモードのスパース部分集合に基づく相関表現の学習法である $ell_0$-CCA を提案する。
論文 参考訳(メタデータ) (2020-10-12T11:44:15Z) - High-Dimensional Quadratic Discriminant Analysis under Spiked Covariance
Model [101.74172837046382]
そこで本研究では,魚の識別比を最大化する2次分類手法を提案する。
数値シミュレーションにより,提案した分類器は,合成データと実データの両方において古典的R-QDAよりも優れるだけでなく,計算量の削減も要求されることがわかった。
論文 参考訳(メタデータ) (2020-06-25T12:00:26Z) - Probabilistic Canonical Correlation Analysis for Sparse Count Data [3.1753001245931323]
正準相関解析は2つの連続変数間の関係を探索する重要な手法である。
2つのスパースカウントデータセットの相関と正準相関推定のためのモデルに基づく確率的アプローチを提案する。
論文 参考訳(メタデータ) (2020-05-11T02:19:57Z) - Sparse Generalized Canonical Correlation Analysis: Distributed
Alternating Iteration based Approach [18.93565942407577]
Sparse Canonical correlation analysis (CCA) はスパース構造を用いた潜伏情報検出に有用な統計ツールである。
本稿では,多視点データとスパース構造との潜在関係を検出可能な一般標準相関解析(GCCA)を提案する。
論文 参考訳(メタデータ) (2020-04-23T05:53:48Z) - Repulsive Mixture Models of Exponential Family PCA for Clustering [127.90219303669006]
指数関数型家族主成分分析(EPCA)の混合拡張は、従来のEPCAよりもデータ分布に関する構造情報を符号化するように設計された。
従来のEPCAの混合は、モデルの冗長性、すなわち混合成分間の重なりが問題であり、データクラスタリングの曖昧さを引き起こす可能性がある。
本稿では, 混合成分間での反発性増感前処理を導入し, ベイズ式に分散EPCA混合(DEPCAM)モデルを開発した。
論文 参考訳(メタデータ) (2020-04-07T04:07:29Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。