論文の概要: Bidimensional linked matrix factorization for pan-omics pan-cancer
analysis
- arxiv url: http://arxiv.org/abs/2002.02601v2
- Date: Thu, 7 Apr 2022 15:52:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 04:46:20.991681
- Title: Bidimensional linked matrix factorization for pan-omics pan-cancer
analysis
- Title(参考訳): パンオミクス・パンキャンサー解析のための2次元連結行列因子分解
- Authors: Eric F. Lock, Jun Young Park, and Katherine A. Hoadley
- Abstract要約: 本稿では,2次元連結行列 BIDIFAC+ の同時分解と分解に対するフレキシブルなアプローチを提案する。
これは変動を、任意の数の行セットや列セット間で共有できる一連の低ランクなコンポーネントに分解する。
BIDIFAC+をTCGAのパン・オミクス・パン・カンサー・データに適用し、4つの異なるオミクス・プラットフォームと29の異なるがんタイプにまたがる共有および特定の変動様式を同定した。
- 参考スコア(独自算出の注目度): 0.802904964931021
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Several modern applications require the integration of multiple large data
matrices that have shared rows and/or columns. For example, cancer studies that
integrate multiple omics platforms across multiple types of cancer, pan-omics
pan-cancer analysis, have extended our knowledge of molecular heterogenity
beyond what was observed in single tumor and single platform studies. However,
these studies have been limited by available statistical methodology. We
propose a flexible approach to the simultaneous factorization and decomposition
of variation across such bidimensionally linked matrices, BIDIFAC+. This
decomposes variation into a series of low-rank components that may be shared
across any number of row sets (e.g., omics platforms) or column sets (e.g.,
cancer types). This builds on a growing literature for the factorization and
decomposition of linked matrices, which has primarily focused on multiple
matrices that are linked in one dimension (rows or columns) only. Our objective
function extends nuclear norm penalization, is motivated by random matrix
theory, gives an identifiable decomposition under relatively mild conditions,
and can be shown to give the mode of a Bayesian posterior distribution. We
apply BIDIFAC+ to pan-omics pan-cancer data from TCGA, identifying shared and
specific modes of variability across 4 different omics platforms and 29
different cancer types.
- Abstract(参考訳): いくつかの現代的なアプリケーションは、共有行や列を持つ複数の大きなデータ行列を統合する必要がある。
例えば、複数の種類のがんにまたがるomcsプラットフォームを統合するがん研究、pan-omics pan-cancer analysisは、単一腫瘍や単一プラットフォーム研究で観察された以上の分子多様性に関する知識を拡張した。
しかし、これらの研究は利用可能な統計手法によって制限されている。
本稿では,2次元連結行列であるBIDIFAC+の同時分解・分解に対する柔軟なアプローチを提案する。
これは、様々な行集合(例えば、オミクスプラットフォーム)や列集合(例えば、癌の種類)で共有される一連の低ランクなコンポーネントに変化を分解する。
これは、連結行列の分解と分解に関する文献の増大を基盤としており、主に1次元(行または列)でのみ連結された複数の行列に焦点を当てている。
目的関数は核規範のペナリゼーションを拡張し、ランダム行列理論に動機づけられ、比較的穏やかな条件下で識別可能な分解を与え、ベイズ後方分布のモードを与えることができる。
bidifac+ を tcga の pan-omics pan-cancer データに適用し、4つの omics プラットフォームと 29 種類のがんタイプ間で共有および特定の変異モードを特定した。
関連論文リスト
- Empirical Bayes Linked Matrix Decomposition [0.0]
この問題に対する経験的変分ベイズ的アプローチを提案する。
単一行列文脈において新規な反復的計算手法について述べる。
提案手法は,下層の低ランク信号の回復に関して,異なるシナリオ下で非常によく機能することを示す。
論文 参考訳(メタデータ) (2024-08-01T02:13:11Z) - Multiple Augmented Reduced Rank Regression for Pan-Cancer Analysis [0.0]
フレキシブルな行列回帰および分解法である多重強化階数回帰(maRRR)を提案する。
我々は、ランダム行列理論によって動機付けられた構造化された核ノルムの目的を考える。
われわれはTGAの複数の癌型(すなわち膵臓)の遺伝子発現データにmaRRRを適用した。
論文 参考訳(メタデータ) (2023-08-30T21:40:58Z) - DEDUCE: Multi-head attention decoupled contrastive learning to discover cancer subtypes based on multi-omics data [7.049723871585993]
マルチオミクスのがんデータを解析するための教師なしコントラスト学習のためのモデルDDUCEを提案する。
このモデルは教師なしのSMAEを採用し、マルチオミクスデータからコンテキストの特徴や長距離依存を深く抽出することができる。
サブタイプは、マルチオミクスデータの特徴空間とサンプル空間の両方におけるサンプル間の類似性を計算することでクラスタ化される。
論文 参考訳(メタデータ) (2023-07-09T00:53:23Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - A Graphical Model for Fusing Diverse Microbiome Data [2.385985842958366]
本稿では,このような数値データを共同でモデル化するフレキシブルな多項ガウス生成モデルを提案する。
本稿では、潜在変数とモデルのパラメータを推定するための、計算にスケーラブルな変動予測-最大化(EM)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-21T17:54:39Z) - Linear-Sample Learning of Low-Rank Distributions [56.59844655107251]
ktimes k$, rank-r$, matrices to normalized $L_1$ distance requires $Omega(frackrepsilon2)$ sample。
我々は、$cal O(frackrepsilon2log2fracepsilon)$ sample, a number linear in the high dimension, and almost linear in the matrices, usually low, rank proofs.というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-30T19:10:32Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Spectral Learning on Matrices and Tensors [74.88243719463053]
テンソル分解は行列法で欠落する潜伏効果を拾うことができることを示す。
また,効率的なテンソル分解法を設計するための計算手法についても概説する。
論文 参考訳(メタデータ) (2020-04-16T22:53:00Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - D-GCCA: Decomposition-based Generalized Canonical Correlation Analysis
for Multi-view High-dimensional Data [11.184915338554422]
高次元多視点データ分析における一般的なモデルは、各ビューのデータ行列を、すべてのデータビューに共通する潜在因子によって生成される低ランクの共通ソース行列に分解する。
本稿では,分解に基づく一般化正準相関解析(D-GCCA)と呼ばれる新しい分解法を提案する。
我々のD-GCCAは、共通成分と特異成分を正準変数から分離することにより、一般化された正準相関解析よりも一歩前進する。
論文 参考訳(メタデータ) (2020-01-09T06:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。