論文の概要: ScRAE: Deterministic Regularized Autoencoders with Flexible Priors for
Clustering Single-cell Gene Expression Data
- arxiv url: http://arxiv.org/abs/2107.07709v1
- Date: Fri, 16 Jul 2021 05:13:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-19 14:35:58.949808
- Title: ScRAE: Deterministic Regularized Autoencoders with Flexible Priors for
Clustering Single-cell Gene Expression Data
- Title(参考訳): ScRAE: 1セル遺伝子発現データのクラスタリングのためのフレキシブルプリミティブを持つ決定論的正規化オートエンコーダ
- Authors: Arnab Kumar Mondal, Himanshu Asnani, Parag Singla, Prathosh AP
- Abstract要約: シングルセルRNA配列(scRNA-seq)のクラスタリングは、統計的および計算上の課題を引き起こす。
正規化オートエンコーダ(RAE)ベースのディープニューラルネットワークモデルは、ロバストな低次元表現の学習において大きな成功を収めている。
単一セルRNAシークエンシングデータの効果的なクラスタリングのためのRAEフレームワーク( scRAE と呼ばれる)を提案する。
- 参考スコア(独自算出の注目度): 11.511172015076532
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clustering single-cell RNA sequence (scRNA-seq) data poses statistical and
computational challenges due to their high-dimensionality and data-sparsity,
also known as `dropout' events. Recently, Regularized Auto-Encoder (RAE) based
deep neural network models have achieved remarkable success in learning robust
low-dimensional representations. The basic idea in RAEs is to learn a
non-linear mapping from the high-dimensional data space to a low-dimensional
latent space and vice-versa, simultaneously imposing a distributional prior on
the latent space, which brings in a regularization effect. This paper argues
that RAEs suffer from the infamous problem of bias-variance trade-off in their
naive formulation. While a simple AE without a latent regularization results in
data over-fitting, a very strong prior leads to under-representation and thus
bad clustering. To address the above issues, we propose a modified RAE
framework (called the scRAE) for effective clustering of the single-cell RNA
sequencing data. scRAE consists of deterministic AE with a flexibly learnable
prior generator network, which is jointly trained with the AE. This facilitates
scRAE to trade-off better between the bias and variance in the latent space. We
demonstrate the efficacy of the proposed method through extensive
experimentation on several real-world single-cell Gene expression datasets.
- Abstract(参考訳): シングルセルRNA配列(scRNA-seq)のクラスタリングは、その高次元性とデータスパーシティ("dropout"イベントとしても知られる)のため、統計的および計算上の問題を引き起こす。
近年,RAE(Regularized Auto-Encoder)に基づくディープニューラルネットワークモデルが,ロバストな低次元表現の学習に成功している。
RAEの基本的な考え方は、高次元のデータ空間から低次元の潜伏空間と逆転空間への非線形写像を学習し、同時に潜伏空間に分布を先行させ、正規化効果をもたらすことである。
本稿では,RAEは偏差トレードオフという悪名高い問題に悩まされていることを論じる。
遅延正規化のない単純なAEはデータの過度な適合をもたらすが、非常に強力な事前処理は表現不足やクラスタリングの低下につながる。
以上の課題に対処するため,単一セルRNAシークエンシングデータの効率的なクラスタリングのためのRAEフレームワーク( scRAE と呼ばれる)を提案する。
scRAEは決定論的AEと柔軟に学習可能な先行ジェネレータネットワークから構成されており、AEと共同で訓練されている。
これにより、scRAEは潜在空間におけるバイアスと分散の間のトレードオフを改善することができる。
提案手法の有効性を実世界の複数セルの遺伝子発現データセットを用いて実験的に実証する。
関連論文リスト
- ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Differentially private sliced inverse regression in the federated
paradigm [3.539008590223188]
Sliced inverse regression(SIR)を拡張して、分散データの課題に対処し、プライバシと通信効率を優先する。
我々の手法はFSIR (Federated sliced inverse regression) と呼ばれ、複数のクライアント間で十分な次元削減部分空間を協調的に推定する。
論文 参考訳(メタデータ) (2023-06-10T00:32:39Z) - Momentum Contrastive Autoencoder: Using Contrastive Learning for Latent
Space Distribution Matching in WAE [51.09507030387935]
Wasserstein autoencoder (WAE) は、2つの分布が一致することは、このAEの潜在空間が予め指定された事前分布と一致するという制約の下で、単純なオートエンコーダ(AE)損失を最小限にすることと同値であることを示している。
本稿では,この問題を解決する手段として,自己指導型表現学習に有効であることを示すコントラスト学習フレームワークを提案する。
WAEの損失を最適化するために、対照的な学習フレームワークを使用することで、WAEの一般的なアルゴリズムと比較して、より高速に収束し、より安定した最適化が達成できることを示す。
論文 参考訳(メタデータ) (2021-10-19T22:55:47Z) - Approximate kNN Classification for Biomedical Data [1.1852406625172218]
Single-cell RNA-seq (scRNA-seq) は、将来性はあるが重要な計算課題を持つDNAシークエンシング技術である。
scRNA-seqデータにおけるkNN分類のタスクに近似した近接探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-03T18:30:43Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - CASTLE: Regularization via Auxiliary Causal Graph Discovery [89.74800176981842]
因果構造学習(CASTLE)の正規化を導入し,変数間の因果関係を共同学習することでニューラルネットワークの正規化を提案する。
CASTLEは因果的隣り合いを持つ因果的DAGの特徴のみを効率的に再構成する一方、再構成ベース正規化器は全ての入力特徴を過度に再構成する。
論文 参考訳(メタデータ) (2020-09-28T09:49:38Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Robust Locality-Aware Regression for Labeled Data Classification [5.432221650286726]
本稿では,ロバスト局所性認識回帰(RLAR)という特徴抽出フレームワークを提案する。
本モデルでは,クラス間の平均差を使わずに,適応的に境界表現学習を行うために再ターゲット回帰を導入する。
外れ値の乱れを緩和し、過度な適合を防止するため、L2,1ノルムによる正規化項とともに回帰項と局所性を考慮した項を計測する。
論文 参考訳(メタデータ) (2020-06-15T11:36:59Z) - To Regularize or Not To Regularize? The Bias Variance Trade-off in
Regularized AEs [10.611727286504994]
AEモデルの生成決定論的品質に及ぼす潜伏剤の影響について検討する。
我々は、FlexAEと呼ばれるモデルが、AEベースの生成モデルのための新しい最先端技術であることを示します。
論文 参考訳(メタデータ) (2020-06-10T14:00:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。