論文の概要: Multi-layer matrix factorization for cancer subtyping using full and partial multi-omics dataset
- arxiv url: http://arxiv.org/abs/2411.15180v1
- Date: Mon, 18 Nov 2024 20:58:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-01 04:14:34.866612
- Title: Multi-layer matrix factorization for cancer subtyping using full and partial multi-omics dataset
- Title(参考訳): 完全および部分的マルチオミクスデータセットを用いた癌サブタイピングのための多層行列因子化
- Authors: Yingxuan Ren, Fengtao Ren, Bo Yang,
- Abstract要約: 本稿では,マルチオミクスデータクラスタリングを用いた癌サブタイプのための新しいアプローチとして,MLMF(Multi-Layer Matrix Factorization)を提案する。
完全かつ欠落した値を持つ10のマルチオミクスがんデータセットで実施された実験では、Fがいくつかの最先端アプローチのパフォーマンスに匹敵する結果を得るか、超える結果が得られることを示した。
- 参考スコア(独自算出の注目度): 3.110068567404913
- License:
- Abstract: Cancer, with its inherent heterogeneity, is commonly categorized into distinct subtypes based on unique traits, cellular origins, and molecular markers specific to each type. However, current studies primarily rely on complete multi-omics datasets for predicting cancer subtypes, often overlooking predictive performance in cases where some omics data may be missing and neglecting implicit relationships across multiple layers of omics data integration. This paper introduces Multi-Layer Matrix Factorization (MLMF), a novel approach for cancer subtyping that employs multi-omics data clustering. MLMF initially processes multi-omics feature matrices by performing multi-layer linear or nonlinear factorization, decomposing the original data into latent feature representations unique to each omics type. These latent representations are subsequently fused into a consensus form, on which spectral clustering is performed to determine subtypes. Additionally, MLMF incorporates a class indicator matrix to handle missing omics data, creating a unified framework that can manage both complete and incomplete multi-omics data. Extensive experiments conducted on 10 multi-omics cancer datasets, both complete and with missing values, demonstrate that MLMF achieves results that are comparable to or surpass the performance of several state-of-the-art approaches.
- Abstract(参考訳): 癌は、その固有の不均一性を持つが、通常、特異な特徴、細胞起源、および各タイプ固有の分子マーカーに基づいて、異なるサブタイプに分類される。
しかしながら、最近の研究では、がんのサブタイプを予測するために、主に完全なマルチオミクスデータセットに依存しており、一部のオミクスデータが欠落している可能性がある場合や、複数のオミクスデータ統合層にわたる暗黙の関係を無視している場合において、予測性能を見落としていることが多い。
本稿では,マルチオミクスデータクラスタリングを用いた癌サブタイプのための新しいアプローチとして,MLMF(Multi-Layer Matrix Factorization)を提案する。
MLMFは最初、複数の層を線形あるいは非線形に分解することでマルチオミクス特徴行列を処理し、元のデータを各オミクスタイプ固有の潜在特徴表現に分解する。
これらの潜在表現は後にコンセンサス形式に融合され、スペクトルクラスタリングによってサブタイプを決定する。
さらに、MLMFには、欠落したオミクスデータを扱うためにクラスインジケータ行列が組み込まれており、完全なマルチオミクスデータと不完全なマルチオミクスデータの両方を管理する統合フレームワークが作成されている。
完全かつ欠落した値を持つ10のマルチオミクスがんデータセットで実施された大規模な実験は、MLMFがいくつかの最先端アプローチのパフォーマンスに匹敵する、あるいは超越した結果を達成することを実証している。
関連論文リスト
- Latent class analysis for multi-layer categorical data [0.0]
本稿では, より一般的な多層分類データについて考察する。
我々は,新しい統計モデル,多層潜在クラスモデル(多層LCM)を提案する。
論文 参考訳(メタデータ) (2024-08-10T12:31:31Z) - Empirical Bayes Linked Matrix Decomposition [0.0]
この問題に対する経験的変分ベイズ的アプローチを提案する。
単一行列文脈において新規な反復的計算手法について述べる。
提案手法は,下層の低ランク信号の回復に関して,異なるシナリオ下で非常によく機能することを示す。
論文 参考訳(メタデータ) (2024-08-01T02:13:11Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - DEDUCE: Multi-head attention decoupled contrastive learning to discover cancer subtypes based on multi-omics data [7.049723871585993]
マルチオミクスのがんデータを解析するための教師なしコントラスト学習のためのモデルDDUCEを提案する。
このモデルは教師なしのSMAEを採用し、マルチオミクスデータからコンテキストの特徴や長距離依存を深く抽出することができる。
サブタイプは、マルチオミクスデータの特徴空間とサンプル空間の両方におけるサンプル間の類似性を計算することでクラスタ化される。
論文 参考訳(メタデータ) (2023-07-09T00:53:23Z) - One-step Multi-view Clustering with Diverse Representation [47.41455937479201]
本稿では,多視点学習と$k$-meansを統合フレームワークに組み込んだ一段階のマルチビュークラスタリングを提案する。
そこで本研究では,効率の良い最適化アルゴリズムを開発し,その解法について述べる。
論文 参考訳(メタデータ) (2023-06-08T02:52:24Z) - CLCLSA: Cross-omics Linked embedding with Contrastive Learning and Self
Attention for multi-omics integration with incomplete multi-omics data [47.2764293508916]
不均一・高次元マルチオミクスデータの統合は、遺伝データの理解においてますます重要になっている。
マルチオミクスデータ統合を行う際に直面する障害のひとつは、機器の感度とコストによる未ペアリングマルチオミクスデータの存在である。
クロスオミクスを用いたマルチオミクス統合のための深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-04-12T00:22:18Z) - Feature Weighted Non-negative Matrix Factorization [92.45013716097753]
本稿では,FNMF(Feature weighted Non- negative Matrix Factorization)を提案する。
FNMFはその重要性に応じて特徴の重みを適応的に学習する。
提案する最適化アルゴリズムを用いて効率的に解くことができる。
論文 参考訳(メタデータ) (2021-03-24T21:17:17Z) - Entropy Minimizing Matrix Factorization [102.26446204624885]
NMF(Nonnegative Matrix Factorization)は、広く使用されているデータ分析技術であり、多くの実際のタスクで印象的な結果をもたらしました。
本研究では,上述の問題に対処するために,EMMF (Entropy Minimizing Matrix Factorization framework) を開発した。
通常、外れ値が通常のサンプルよりもはるかに小さいことを考えると、行列分解のために新しいエントロピー損失関数が確立される。
論文 参考訳(メタデータ) (2021-03-24T21:08:43Z) - Kernel learning approaches for summarising and combining posterior
similarity matrices [68.8204255655161]
我々は,ベイズクラスタリングモデルに対するMCMCアルゴリズムの出力を要約するための新しいアプローチを提案するために,後部類似性行列(PSM)の概念を構築した。
我々の研究の重要な貢献は、PSMが正の半定値であり、したがって確率的に動機付けられたカーネル行列を定義するのに使用できることである。
論文 参考訳(メタデータ) (2020-09-27T14:16:14Z) - Bidimensional linked matrix factorization for pan-omics pan-cancer
analysis [0.802904964931021]
本稿では,2次元連結行列 BIDIFAC+ の同時分解と分解に対するフレキシブルなアプローチを提案する。
これは変動を、任意の数の行セットや列セット間で共有できる一連の低ランクなコンポーネントに分解する。
BIDIFAC+をTCGAのパン・オミクス・パン・カンサー・データに適用し、4つの異なるオミクス・プラットフォームと29の異なるがんタイプにまたがる共有および特定の変動様式を同定した。
論文 参考訳(メタデータ) (2020-02-07T03:11:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。