論文の概要: Multiple Augmented Reduced Rank Regression for Pan-Cancer Analysis
- arxiv url: http://arxiv.org/abs/2308.16333v1
- Date: Wed, 30 Aug 2023 21:40:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-01 18:17:54.842922
- Title: Multiple Augmented Reduced Rank Regression for Pan-Cancer Analysis
- Title(参考訳): パンキャンサー解析のための多重増減ランク回帰
- Authors: Jiuzhou Wang and Eric F. Lock
- Abstract要約: フレキシブルな行列回帰および分解法である多重強化階数回帰(maRRR)を提案する。
我々は、ランダム行列理論によって動機付けられた構造化された核ノルムの目的を考える。
われわれはTGAの複数の癌型(すなわち膵臓)の遺伝子発現データにmaRRRを適用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Statistical approaches that successfully combine multiple datasets are more
powerful, efficient, and scientifically informative than separate analyses. To
address variation architectures correctly and comprehensively for
high-dimensional data across multiple sample sets (i.e., cohorts), we propose
multiple augmented reduced rank regression (maRRR), a flexible matrix
regression and factorization method to concurrently learn both covariate-driven
and auxiliary structured variation. We consider a structured nuclear norm
objective that is motivated by random matrix theory, in which the regression or
factorization terms may be shared or specific to any number of cohorts. Our
framework subsumes several existing methods, such as reduced rank regression
and unsupervised multi-matrix factorization approaches, and includes a
promising novel approach to regression and factorization of a single dataset
(aRRR) as a special case. Simulations demonstrate substantial gains in power
from combining multiple datasets, and from parsimoniously accounting for all
structured variation. We apply maRRR to gene expression data from multiple
cancer types (i.e., pan-cancer) from TCGA, with somatic mutations as
covariates. The method performs well with respect to prediction and imputation
of held-out data, and provides new insights into mutation-driven and auxiliary
variation that is shared or specific to certain cancer types.
- Abstract(参考訳): 複数のデータセットをうまく組み合わせる統計的アプローチは、分離した分析よりも強力で効率的で科学的に有益である。
複数のサンプル集合(つまりコホート)にまたがる高次元データに対して、変動アーキテクチャを正確かつ包括的に扱うため、共変量駆動と補助的構造変化の両方を同時に学習する柔軟な行列回帰および因子分解法であるmultiple augmented reduced rank regression (marrr)を提案する。
我々は、回帰項や因子化項を任意の数のコホートと共有したり特定したりできるランダム行列理論によって動機づけられる構造化核規範の目的を考える。
本フレームワークは,ランク回帰の低減や教師なしマルチマトリックス因数分解アプローチなどの既存手法を仮定し,単一のデータセット(aRRR)の回帰と因数分解に対する有望な新しいアプローチを含む。
シミュレーションは、複数のデータセットを組み合わせることや、すべての構造化された変動を同義に説明することによるパワーの大幅な向上を示す。
我々は,TCGAの複数種類の癌(すなわち膵臓)の遺伝子発現データにmaRRRを適用し,体細胞変異を共変体とした。
この方法はホールドアウトデータの予測と計算に関して良好に機能し、特定のがんタイプに共有または特異的な突然変異駆動および補助変異に関する新たな知見を提供する。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Empirical Bayes Linked Matrix Decomposition [0.0]
この問題に対する経験的変分ベイズ的アプローチを提案する。
単一行列文脈において新規な反復的計算手法について述べる。
提案手法は,下層の低ランク信号の回復に関して,異なるシナリオ下で非常によく機能することを示す。
論文 参考訳(メタデータ) (2024-08-01T02:13:11Z) - Recurrence Boosts Diversity! Revisiting Recurrent Latent Variable in
Transformer-Based Variational AutoEncoder for Diverse Text Generation [85.5379146125199]
変分自動エンコーダ(VAE)はテキスト生成において広く採用されている。
本稿ではトランスフォーマーをベースとしたリカレントVAE構造であるTRACEを提案する。
論文 参考訳(メタデータ) (2022-10-22T10:25:35Z) - Machine Learning for Multi-Output Regression: When should a holistic
multivariate approach be preferred over separate univariate ones? [62.997667081978825]
ランダムフォレストのような木に基づくアンサンブルは、統計学の手法の中で近代的な古典である。
これらの手法を広範囲なシミュレーションで比較し,多変量アンサンブル技術を用いた場合の主問題に答える。
論文 参考訳(メタデータ) (2022-01-14T08:44:25Z) - High-dimensional multi-trait GWAS by reverse prediction of genotypes [3.441021278275805]
逆回帰は、高次元設定でマルチトレイGWASを実行するための有望なアプローチである。
マルチトランジットGWASにおける逆回帰のための異なる機械学習手法を解析した。
モデル特徴係数は変異体と個々の形質の関連性の強さと相関し,真のトランス-eQTL標的遺伝子を予測した。
論文 参考訳(メタデータ) (2021-10-29T22:34:35Z) - Nonparametric Trace Regression in High Dimensions via Sign Series
Representation [13.37650464374017]
高次元関数の構造的符号系列表現による非パラメトリックトレース回帰モデルのためのフレームワークを開発する。
行列完備化の文脈において、我々のフレームワークは、行列の「符号ランク」と呼ばれるものに基づいて、かなりリッチなモデルへと導かれる。
論文 参考訳(メタデータ) (2021-05-04T22:20:00Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z) - Two-step penalised logistic regression for multi-omic data with an
application to cardiometabolic syndrome [62.997667081978825]
我々は,各層で変数選択を行うマルチオミックロジスティック回帰に対する2段階のアプローチを実装した。
私たちのアプローチは、可能な限り多くの関連する予測子を選択することを目標とすべきです。
提案手法により,分子レベルでの心筋メタボリックシンドロームの特徴を同定することができる。
論文 参考訳(メタデータ) (2020-08-01T10:36:27Z) - Fast cross-validation for multi-penalty ridge regression [0.0]
リッジ回帰は高次元データの単純なモデルである。
我々の主な貢献は、多孔質でサンプル重み付けされた帽子行列に対する計算的に非常に効率的な公式である。
ペアデータ型および優先データ型への拡張は、いくつかのがんゲノム生存予測問題に含まれ、図示されている。
論文 参考訳(メタデータ) (2020-05-19T09:13:43Z) - Towards Multimodal Response Generation with Exemplar Augmentation and
Curriculum Optimization [73.45742420178196]
本稿では,高度化とカリキュラム最適化を併用した,新しいマルチモーダル応答生成フレームワークを提案する。
我々のモデルは多様性と妥当性の点で強いベースラインに比べて大幅に改善されている。
論文 参考訳(メタデータ) (2020-04-26T16:29:06Z) - D-GCCA: Decomposition-based Generalized Canonical Correlation Analysis
for Multi-view High-dimensional Data [11.184915338554422]
高次元多視点データ分析における一般的なモデルは、各ビューのデータ行列を、すべてのデータビューに共通する潜在因子によって生成される低ランクの共通ソース行列に分解する。
本稿では,分解に基づく一般化正準相関解析(D-GCCA)と呼ばれる新しい分解法を提案する。
我々のD-GCCAは、共通成分と特異成分を正準変数から分離することにより、一般化された正準相関解析よりも一歩前進する。
論文 参考訳(メタデータ) (2020-01-09T06:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。