論文の概要: Graph Canonical Correlation Analysis
- arxiv url: http://arxiv.org/abs/2502.01780v1
- Date: Mon, 03 Feb 2025 19:41:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:03:56.002885
- Title: Graph Canonical Correlation Analysis
- Title(参考訳): グラフ正準相関解析
- Authors: Hongju Park, Shuyang Bai, Zhenyao Ye, Hwiyoung Lee, Tianzhou Ma, Shuo Chen,
- Abstract要約: カノニカル相関解析(Canonical correlation analysis, CCA)は、2つの変数間の関係を推定する手法として広く用いられている。
CCA法の最近の進歩は、マルチオミクスデータセットの相互作用を解読するための応用を拡大している。
相関行列のグラフ構造に基づいて正準相関を計算するグラフ正準相関解析(gCCA)手法を提案する。
- 参考スコア(独自算出の注目度): 2.588462392029118
- License:
- Abstract: Canonical correlation analysis (CCA) is a widely used technique for estimating associations between two sets of multi-dimensional variables. Recent advancements in CCA methods have expanded their application to decipher the interactions of multiomics datasets, imaging-omics datasets, and more. However, conventional CCA methods are limited in their ability to incorporate structured patterns in the cross-correlation matrix, potentially leading to suboptimal estimations. To address this limitation, we propose the graph Canonical Correlation Analysis (gCCA) approach, which calculates canonical correlations based on the graph structure of the cross-correlation matrix between the two sets of variables. We develop computationally efficient algorithms for gCCA, and provide theoretical results for finite sample analysis of best subset selection and canonical correlation estimation by introducing concentration inequalities and stopping time rule based on martingale theories. Extensive simulations demonstrate that gCCA outperforms competing CCA methods. Additionally, we apply gCCA to a multiomics dataset of DNA methylation and RNA-seq transcriptomics, identifying both positively and negatively regulated gene expression pathways by DNA methylation pathways.
- Abstract(参考訳): 正準相関解析(Canonical correlation analysis, CCA)は、2組の多次元変数間の関係を推定するために広く用いられている手法である。
CCA法の最近の進歩は、マルチオミクスデータセット、イメージング・オミクスデータセットなどの相互作用を解読するための応用を拡大している。
しかし、従来のCCA法は、相互相関行列に構造化パターンを組み込む能力に制限されており、潜在的に最適以下の推定に繋がる可能性がある。
この制限に対処するために,変数の2つの集合間の相互相関行列のグラフ構造に基づいて正準相関を計算するグラフ正準相関解析(gCCA)手法を提案する。
我々は,gCCAの計算効率の良いアルゴリズムを開発し,マルティンゲール理論に基づく濃度不等式の導入と時間規則の停止による,最良部分集合選択の有限サンプル解析と正準相関推定の理論的結果を提供する。
大規模なシミュレーションにより、gCCAは競合するCCA法より優れていることが示された。
さらに、gCCAをDNAメチル化およびRNA-seq転写産物のマルチオミクスデータセットに適用し、DNAメチル化経路による正および負の制御された遺伝子発現経路の両方を同定する。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Nearest Neighbor CCP-Based Molecular Sequence Analysis [4.199844472131922]
Corelated Clustering and Projection (CCP) は生物学的シークエンシングデータに有効な方法として提案されている。
分子シークエンスデータを効率的に前処理するためのCCP-NN(Nearest Neighbor Correlated Clustering and Projection)に基づく手法を提案する。
以上の結果から,CCP-NNは分類タスクの精度を大幅に向上し,計算実行時においてCCPを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2024-09-07T22:06:00Z) - Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Applications of flow models to the generation of correlated lattice QCD ensembles [69.18453821764075]
機械学習された正規化フローは、格子量子場理論の文脈で、異なる作用パラメータで格子ゲージ場の統計的に相関したアンサンブルを生成するために用いられる。
本研究は,これらの相関を可観測物の計算における分散低減に活用する方法を実証する。
論文 参考訳(メタデータ) (2024-01-19T18:33:52Z) - K-Nearest-Neighbors Induced Topological PCA for scRNA Sequence Data
Analysis [0.3683202928838613]
永続ラプラシアン(PL)法とL$_2,1$ノルム正規化を組み合わせたトポロジカルプライマリコンポーネント分析(tPCA)法を提案する。
さらに, k-Nearest-Neighbor (kNN) の永続ラプラス的手法を導入し, 永続ラプラス的手法の堅牢性を向上させる。
提案したtPCA法とkNN-tPCA法の有効性を,11種類のscRNA-seqデータセット上で検証した。
論文 参考訳(メタデータ) (2023-10-23T03:07:50Z) - Tensor Generalized Canonical Correlation Analysis [0.0]
Generalized Generalized Canonical correlation Analysis (RGCCA)は、マルチブロックデータ分析のための一般的な統計フレームワークである。
本稿では,高次テンソルを標準ランクR分解で解析する TGCCA を提案する。
TGCCAの有効性と有用性は、シミュレーションおよび実データに基づいて評価され、最先端の手法と比較して好意的に比較される。
論文 参考訳(メタデータ) (2023-02-10T14:41:12Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - DAGs with No Curl: An Efficient DAG Structure Learning Approach [62.885572432958504]
近年のDAG構造学習は連続的な非巡回性制約を伴う制約付き連続最適化問題として定式化されている。
本稿では,DAG空間の重み付き隣接行列を直接モデル化し,学習するための新しい学習フレームワークを提案する。
本手法は, 線形および一般化された構造方程式モデルにおいて, ベースラインDAG構造学習法よりも精度が高いが, 効率がよいことを示す。
論文 参考訳(メタデータ) (2021-06-14T07:11:36Z) - Joint Network Topology Inference via Structured Fusion Regularization [70.30364652829164]
結合ネットワークトポロジ推論は、異種グラフ信号から複数のグラフラプラシア行列を学習する標準的な問題を表す。
新規な構造化融合正規化に基づく一般グラフ推定器を提案する。
提案するグラフ推定器は高い計算効率と厳密な理論保証の両方を享受できることを示す。
論文 参考訳(メタデータ) (2021-03-05T04:42:32Z) - Probabilistic Canonical Correlation Analysis for Sparse Count Data [3.1753001245931323]
正準相関解析は2つの連続変数間の関係を探索する重要な手法である。
2つのスパースカウントデータセットの相関と正準相関推定のためのモデルに基づく確率的アプローチを提案する。
論文 参考訳(メタデータ) (2020-05-11T02:19:57Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。