論文の概要: Is your data alignable? Principled and interpretable alignability
testing and integration of single-cell data
- arxiv url: http://arxiv.org/abs/2308.01839v1
- Date: Thu, 3 Aug 2023 16:04:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 13:41:19.011652
- Title: Is your data alignable? Principled and interpretable alignability
testing and integration of single-cell data
- Title(参考訳): あなたのデータは調整可能ですか。
原理的・解釈可能な整合性試験と単細胞データの統合
- Authors: Rong Ma, Eric D. Sun, David Donoho and James Zou
- Abstract要約: 単細胞データ統合は、細胞の包括的な分子ビューを提供する。
既存の方法にはいくつかの基本的な制限がある。
スペクトル多様体アライメントと推論の枠組みを提案する。
- 参考スコア(独自算出の注目度): 11.73944380543084
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Single-cell data integration can provide a comprehensive molecular view of
cells, and many algorithms have been developed to remove unwanted technical or
biological variations and integrate heterogeneous single-cell datasets. Despite
their wide usage, existing methods suffer from several fundamental limitations.
In particular, we lack a rigorous statistical test for whether two
high-dimensional single-cell datasets are alignable (and therefore should even
be aligned). Moreover, popular methods can substantially distort the data
during alignment, making the aligned data and downstream analysis difficult to
interpret. To overcome these limitations, we present a spectral manifold
alignment and inference (SMAI) framework, which enables principled and
interpretable alignability testing and structure-preserving integration of
single-cell data. SMAI provides a statistical test to robustly determine the
alignability between datasets to avoid misleading inference, and is justified
by high-dimensional statistical theory. On a diverse range of real and
simulated benchmark datasets, it outperforms commonly used alignment methods.
Moreover, we show that SMAI improves various downstream analyses such as
identification of differentially expressed genes and imputation of single-cell
spatial transcriptomics, providing further biological insights. SMAI's
interpretability also enables quantification and a deeper understanding of the
sources of technical confounders in single-cell data.
- Abstract(参考訳): 単細胞データ統合は、細胞の包括的な分子ビューを提供することができ、多くのアルゴリズムが不要な技術的または生物学的なバリエーションを取り除き、異種単細胞データセットを統合するために開発されている。
広く使われているにもかかわらず、既存の手法にはいくつかの基本的な制限がある。
特に、2つの高次元のシングルセルデータセットが整列可能であるかどうかの厳密な統計試験が欠如している(従って整列すべきである)。
さらに、一般的な手法は、アライメント中にデータを実質的に歪め、アライメントされたデータと下流分析を解釈しにくくする。
これらの制約を克服するために、単セルデータの整合性テストと構造保存統合を可能にするスペクトル多様体アライメントと推論(SMAI)フレームワークを提案する。
SMAIは、誤解を招く推論を避けるためにデータセット間の整合性をしっかりと決定する統計テストを提供し、高次元統計理論によって正当化される。
さまざまなリアルデータセットとシミュレートされたベンチマークデータセットでは、一般的に使用されるアライメントメソッドよりも優れています。
さらに, smaiは, 遺伝的に発現した遺伝子の同定や, 単細胞空間転写産物のインプテーションなど, 下流の様々な解析方法を改善し, さらなる生物学的知見を提供する。
SMAIの解釈可能性はまた、単一セルデータにおける技術共同創設者の情報源の定量化とより深い理解を可能にする。
関連論文リスト
- Assumption-Lean Post-Integrated Inference with Negative Control Outcomes [0.0]
負の制御結果を用いて遅延不均一性を調整する頑健なポストインテグレート推論(PII)手法を提案する。
我々の仮定リーン半推論手法は、仲介者、共同設立者、モデレーターを考慮に入れた予測された直接効果推定に頑健さと一般性を広げる。
提案した二重頑健な推定器は最小限の仮定の下で一貫性があり、機械学習アルゴリズムによるデータ適応推定を容易にする。
論文 参考訳(メタデータ) (2024-10-07T12:52:38Z) - CAVACHON: a hierarchical variational autoencoder to integrate multi-modal single-cell data [10.429856767305687]
マルチモーダルデータ間の条件付き独立関係を明示的に組み込んだ新しい確率論的学習フレームワークを提案する。
単セルマルチオミクスデータ統合に関連する様々なアプリケーションにおけるフレームワークの汎用性を実証する。
論文 参考訳(メタデータ) (2024-05-28T23:44:09Z) - Scalable Amortized GPLVMs for Single Cell Transcriptomics Data [9.010523724015398]
大規模単細胞RNA-seqデータの解析には次元化が不可欠である。
改良されたモデル、償却変分モデル(BGPLVM)を導入する。
BGPLVMは、特殊なエンコーダ、カーネル、そして可能性設計を備えたシングルセルRNA-seq向けに調整されている。
論文 参考訳(メタデータ) (2024-05-06T21:54:38Z) - Physics-informed and Unsupervised Riemannian Domain Adaptation for Machine Learning on Heterogeneous EEG Datasets [53.367212596352324]
脳波信号物理を利用した教師なし手法を提案する。
脳波チャンネルをフィールド、ソースフリーなドメイン適応を用いて固定位置にマッピングする。
提案手法は脳-コンピュータインタフェース(BCI)タスクおよび潜在的なバイオマーカー応用におけるロバストな性能を示す。
論文 参考訳(メタデータ) (2024-03-07T16:17:33Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Contrastive Cycle Adversarial Autoencoders for Single-cell Multi-omics
Alignment and Integration [0.0]
本稿では,単一セルRNA-seqデータと単一セルATAC-seqデータとの整合と統合のための新しいフレームワークを提案する。
他の最先端手法と比較して,本手法はシミュレーションデータと実シングルセルデータの両方において優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-12-05T13:00:58Z) - General stochastic separation theorems with optimal bounds [68.8204255655161]
分離性の現象が明らかになり、機械学習で人工知能(AI)システムのエラーを修正し、AI不安定性を分析するために使用された。
エラーやエラーのクラスタは、残りのデータから分離することができる。
AIシステムを修正する能力は、それに対する攻撃の可能性も開き、高次元性は、同じ分離性によって引き起こされる脆弱性を誘発する。
論文 参考訳(メタデータ) (2020-10-11T13:12:41Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。