論文の概要: Probabilistic Canonical Correlation Analysis for Sparse Count Data
- arxiv url: http://arxiv.org/abs/2005.04837v1
- Date: Mon, 11 May 2020 02:19:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 20:39:08.237566
- Title: Probabilistic Canonical Correlation Analysis for Sparse Count Data
- Title(参考訳): スパースカウントデータの確率的正準相関解析
- Authors: Lin Qiu and Vernon M. Chinchilli
- Abstract要約: 正準相関解析は2つの連続変数間の関係を探索する重要な手法である。
2つのスパースカウントデータセットの相関と正準相関推定のためのモデルに基づく確率的アプローチを提案する。
- 参考スコア(独自算出の注目度): 3.1753001245931323
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Canonical correlation analysis (CCA) is a classical and important
multivariate technique for exploring the relationship between two sets of
continuous variables. CCA has applications in many fields, such as genomics and
neuroimaging. It can extract meaningful features as well as use these features
for subsequent analysis. Although some sparse CCA methods have been developed
to deal with high-dimensional problems, they are designed specifically for
continuous data and do not consider the integer-valued data from
next-generation sequencing platforms that exhibit very low counts for some
important features. We propose a model-based probabilistic approach for
correlation and canonical correlation estimation for two sparse count data sets
(PSCCA). PSCCA demonstrates that correlations and canonical correlations
estimated at the natural parameter level are more appropriate than traditional
estimation methods applied to the raw data. We demonstrate through simulation
studies that PSCCA outperforms other standard correlation approaches and sparse
CCA approaches in estimating the true correlations and canonical correlations
at the natural parameter level. We further apply the PSCCA method to study the
association of miRNA and mRNA expression data sets from a squamous cell lung
cancer study, finding that PSCCA can uncover a large number of strongly
correlated pairs than standard correlation and other sparse CCA approaches.
- Abstract(参考訳): 正準相関解析(CCA)は、2つの連続変数間の関係を探索する古典的かつ重要な多変量解析手法である。
CCAはゲノミクスやニューロイメージングなど多くの分野で応用されている。
意味のある特徴を抽出できるだけでなく、これらの特徴をその後の分析に使うことができる。
いくつかのスパースCCA法は高次元問題に対処するために開発されたが、連続データ用に特別に設計されており、いくつかの重要な特徴に対して非常に少ない数を示す次世代のシーケンシングプラットフォームからの整数値データを考慮していない。
2つのスパースカウントデータセット(PSCCA)の相関と正準相関推定のためのモデルに基づく確率的アプローチを提案する。
PSCCAは、自然パラメータレベルで推定される相関と正準相関が、原データに適用される従来の推定方法よりも適切であることを示した。
シミュレーションにより,PSCCAは他の標準相関法やスパースCCA法よりも自然パラメータレベルでの真の相関と正準相関を推定できることを示した。
さらに, 扁平上皮肺癌研究から得られたmirnaとmrnaの発現データセットの関連性をpscca法を用いて検討し, 標準相関法やばらばらなcca法に比べてpsccaが強い相関関係を持つペアを多数発見できることを見いだした。
関連論文リスト
- Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
さらに、テストポイントがトレーニングセットと非自明な相関を持ち、時系列予測で頻繁に発生するような場合まで分析を拡張します。
我々は多種多様な高次元データにまたがって理論を検証する。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - A Bayesian Methodology for Estimation for Sparse Canonical Correlation [0.0]
標準相関解析(CCA)は、データセット間の関係を識別する統計手法である。
ScSCCAは、異なるデータモダリティ間の相互関係の堅牢なモデリングを目的とした、急速に発展する方法論分野である。
ベイズ無限因子モデルを用いて,ロバストな推定を実現する新しいSCSCCA手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T15:14:25Z) - Tensor Generalized Canonical Correlation Analysis [0.0]
Generalized Generalized Canonical correlation Analysis (RGCCA)は、マルチブロックデータ分析のための一般的な統計フレームワークである。
本稿では,高次テンソルを標準ランクR分解で解析する TGCCA を提案する。
TGCCAの有効性と有用性は、シミュレーションおよび実データに基づいて評価され、最先端の手法と比較して好意的に比較される。
論文 参考訳(メタデータ) (2023-02-10T14:41:12Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Multi-modality fusion using canonical correlation analysis methods:
Application in breast cancer survival prediction from histology and genomics [16.537929113715432]
2つのモードの融合にカノニカル相関解析(CCA)とCCAのペナル化変種を用いて検討した。
モデルパラメータが既知の場合,両モードを併用した後進平均推定器は,潜時変動予測における単一モード後進推定器の任意の線形混合よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-27T21:18:01Z) - Conditional canonical correlation estimation based on covariates with
random forests [0.0]
本研究では,2つの変数間の条件付き正準相関を推定するRFCCAを用いたランダムフォレスト(Random Forest)を提案する。
提案手法と大域的意義試験は,精度の高い正準相関推定とよく制御されたType-1誤差を提供するシミュレーション研究によって評価される。
論文 参考訳(メタデータ) (2020-11-23T17:09:46Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Minimax Quasi-Bayesian estimation in sparse canonical correlation
analysis via a Rayleigh quotient function [1.0878040851638]
スパース標準ベクトルに対する既存の速度-最適推定器は計算コストが高い。
本稿では,最小推定率を達成する準ベイズ推定手法を提案する。
提案手法を用いて臨床変数とプロテオミクスデータを最大に相関させ,Covid-19 病の理解を深める。
論文 参考訳(メタデータ) (2020-10-16T21:00:57Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。