論文の概要: LaCoGSEA: Unsupervised deep learning for pathway analysis via latent correlation
- arxiv url: http://arxiv.org/abs/2601.18604v1
- Date: Mon, 26 Jan 2026 15:45:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.908503
- Title: LaCoGSEA: Unsupervised deep learning for pathway analysis via latent correlation
- Title(参考訳): LaCoGSEA:潜時相関による経路解析のための教師なしディープラーニング
- Authors: Zhiwei Zheng, Kevin Bryson,
- Abstract要約: 経路エンリッチメント解析は、遺伝子発現データの解釈に広く用いられている。
GSEAのような標準的なアプローチは、事前に定義された表現型ラベルとペア比較に依存している。
我々は、深い表現学習と堅牢な経路統計を統合した教師なしのフレームワークであるLaCoGSEAを紹介する。
- 参考スコア(独自算出の注目度): 4.742294289533828
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivation: Pathway enrichment analysis is widely used to interpret gene expression data. Standard approaches, such as GSEA, rely on predefined phenotypic labels and pairwise comparisons, which limits their applicability in unsupervised settings. Existing unsupervised extensions, including single-sample methods, provide pathway-level summaries but primarily capture linear relationships and do not explicitly model gene-pathway associations. More recently, deep learning models have been explored to capture non-linear transcriptomic structure. However, their interpretation has typically relied on generic explainable AI (XAI) techniques designed for feature-level attribution. As these methods are not designed for pathway-level interpretation in unsupervised transcriptomic analyses, their effectiveness in this setting remains limited. Results: To bridge this gap, we introduce LaCoGSEA (Latent Correlation GSEA), an unsupervised framework that integrates deep representation learning with robust pathway statistics. LaCoGSEA employs an autoencoder to capture non-linear manifolds and proposes a global gene-latent correlation metric as a proxy for differential expression, generating dense gene rankings without prior labels. We demonstrate that LaCoGSEA offers three key advantages: (i) it achieves improved clustering performance in distinguishing cancer subtypes compared to existing unsupervised baselines; (ii) it recovers a broader range of biologically meaningful pathways at higher ranks compared with linear dimensionality reduction and gradient-based XAI methods; and (iii) it maintains high robustness and consistency across varying experimental protocols and dataset sizes. Overall, LaCoGSEA provides state-of-the-art performance in unsupervised pathway enrichment analysis. Availability and implementation: https://github.com/willyzzz/LaCoGSEA
- Abstract(参考訳): モチベーション(Motivation): 遺伝子発現データの解釈にパスウェイエンリッチメント分析が広く用いられている。
GSEAのような標準的なアプローチは、事前に定義された表現型ラベルとペア比較に依存しており、教師なし設定での適用性を制限している。
単一サンプル法を含む既存の教師なし拡張は、経路レベルの要約を提供するが、主に線形関係を捉え、遺伝子-経路関連を明示的にモデル化しない。
最近では、非線形転写構造を捉えるためにディープラーニングモデルが研究されている。
しかしながら、それらの解釈は典型的には、機能レベルの属性のために設計された汎用的な説明可能なAI(XAI)技術に依存している。
これらの手法は、教師なし転写解析における経路レベルの解釈のために設計されていないため、この設定の有効性は限定的である。
結果: このギャップを埋めるために, ディープ表現学習とロバストパス統計を統合した非教師なしフレームワークであるLaCoGSEA(Latent correlation GSEA)を導入する。
LaCoGSEAは、非線型多様体をキャプチャするためにオートエンコーダを使用し、微分表現のプロキシとしてグローバルな遺伝子ラテント相関計量を提案し、先行ラベルのない高密度遺伝子ランキングを生成する。
LaCoGSEAには3つの大きな利点があります。
(i)既存の教師なしベースラインと比較して癌サブタイプを識別する際のクラスタリング性能の向上。
(II)線形次元減少法や勾配に基づくXAI法と比較して、より高位に生物学的に有意な経路の広い範囲を回収する。
3) 様々な実験プロトコルとデータセットサイズにまたがる高い堅牢性と一貫性を維持する。
全体として、LaCoGSEAは教師なし経路エンリッチメント分析における最先端のパフォーマンスを提供する。
可用性と実装:https://github.com/willyzzz/LaCoGSEA
関連論文リスト
- GenAR: Next-Scale Autoregressive Generation for Spatial Gene Expression Prediction [15.143858141542532]
GenARは、粗いものから細かいものまで予測を洗練するマルチスケールの自動回帰フレームワークである。
我々は、粗い予測から細かい予測を洗練するマルチスケール自動回帰フレームワークGenARを紹介する。
GenARは、最先端のパフォーマンスを原則として達成し、精密医療とコスト効率のよい分子プロファイリングに潜在的に影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2025-10-05T18:28:21Z) - ReDiSC: A Reparameterized Masked Diffusion Model for Scalable Node Classification with Structured Predictions [64.17845687013434]
本稿では,構造化ノード分類のための構造拡散モデルであるReDiSCを提案する。
本稿では,ReDiSCが最先端のGNN,ラベル伝搬,拡散ベースラインと比較して,優れた,あるいは高い競争力を発揮することを示す。
特にReDiSCは、従来の構造化拡散法が計算制約によって失敗する大規模データセットに効果的にスケールする。
論文 参考訳(メタデータ) (2025-07-19T04:46:53Z) - Normalized Attention Guidance: Universal Negative Guidance for Diffusion Models [57.20761595019967]
注意空間にL1をベースとした正規化・精細化を施した,効率的かつトレーニング不要な機構である正規化注意誘導(NAG)を提案する。
NAGは、CFGが忠実性を維持しながら崩壊する効果的な負のガイダンスを復元する。
NAGはアーキテクチャ(UNet、DiT)、サンプリングレシスタンス(複数ステップ、複数ステップ)、モダリティ(イメージ、ビデオ)をまたいで一般化する
論文 参考訳(メタデータ) (2025-05-27T13:30:46Z) - LAMP: Learnable Meta-Path Guided Adversarial Contrastive Learning for Heterogeneous Graphs [22.322402072526927]
Heterogeneous Graph Contrastive Learning (HGCL)は通常、事前に定義されたメタパスを必要とする。
textsfLAMPは様々なメタパスのサブグラフを統一的で安定した構造に統合する。
textsfLAMPは、精度と堅牢性の観点から、既存の最先端の教師なしモデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-09-10T08:27:39Z) - Large-Scale Targeted Cause Discovery via Learning from Simulated Data [66.51307552703685]
本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。
我々は、シミュレートされたデータに基づいて教師あり学習を用いてニューラルネットワークを訓練し、因果関係を推定する。
大規模遺伝子制御ネットワークにおける因果関係の同定に優れた性能を示す実験結果が得られた。
論文 参考訳(メタデータ) (2024-08-29T02:21:11Z) - Self-supervised Heterogeneous Graph Pre-training Based on Structural
Clustering [20.985559149384795]
SHGP(Self-supervised Heterogeneous Graph Pre-training approach)を提案する。
肯定的な例や否定的な例を生成する必要はない。
最先端の教師なしベースラインや半教師なしベースラインよりも優れている。
論文 参考訳(メタデータ) (2022-10-19T10:55:48Z) - AugmentedPCA: A Python Package of Supervised and Adversarial Linear
Factor Models [0.2148535041822524]
本稿では,主成分分析の目的を,主成分分析の目的を主成分分析の目的とする手法を提案する。
我々は、これらのメソッドをオープンソースのPythonパッケージであるAugmentedPCAに実装し、優れた現実世界のベースラインを作成できる。
オープンソースのRNA-seq癌遺伝子発現データセット上で,これらの因子モデルの有用性を実証する。
論文 参考訳(メタデータ) (2022-01-07T17:08:59Z) - Understanding Overparameterization in Generative Adversarial Networks [56.57403335510056]
generative adversarial network (gans) は、非凹型ミニマックス最適化問題を訓練するために用いられる。
ある理論は、グローバル最適解に対する勾配降下 (gd) の重要性を示している。
ニューラルネットワークジェネレータと線形判別器を併用した多層GANにおいて、GDAは、基礎となる非凹面min-max問題の大域的なサドル点に収束することを示す。
論文 参考訳(メタデータ) (2021-04-12T16:23:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。