論文の概要: Conditionally Invariant Representation Learning for Disentangling
Cellular Heterogeneity
- arxiv url: http://arxiv.org/abs/2307.00558v1
- Date: Sun, 2 Jul 2023 12:52:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 15:27:57.502024
- Title: Conditionally Invariant Representation Learning for Disentangling
Cellular Heterogeneity
- Title(参考訳): 異なるセル不均一性のための条件不変表現学習
- Authors: Hananeh Aliee, Ferdinand Kapl, Soroor Hediyeh-Zadeh, Fabian J. Theis
- Abstract要約: 本稿では,不必要な変数や乱れに条件付き不変な表現を学習するために,ドメインの可変性を活用する新しい手法を提案する。
単細胞ゲノム学におけるデータ統合など,生物の課題に対して本手法を適用した。
具体的には、提案手法は、対象のタスクと無関係なデータバイアスや興味の因果的説明から生物学的信号を解き放つのに役立つ。
- 参考スコア(独自算出の注目度): 25.488181126364186
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel approach that leverages domain variability to
learn representations that are conditionally invariant to unwanted variability
or distractors. Our approach identifies both spurious and invariant latent
features necessary for achieving accurate reconstruction by placing distinct
conditional priors on latent features. The invariant signals are disentangled
from noise by enforcing independence which facilitates the construction of an
interpretable model with a causal semantic. By exploiting the interplay between
data domains and labels, our method simultaneously identifies invariant
features and builds invariant predictors. We apply our method to grand
biological challenges, such as data integration in single-cell genomics with
the aim of capturing biological variations across datasets with many samples,
obtained from different conditions or multiple laboratories. Our approach
allows for the incorporation of specific biological mechanisms, including gene
programs, disease states, or treatment conditions into the data integration
process, bridging the gap between the theoretical assumptions and real
biological applications. Specifically, the proposed approach helps to
disentangle biological signals from data biases that are unrelated to the
target task or the causal explanation of interest. Through extensive
benchmarking using large-scale human hematopoiesis and human lung cancer data,
we validate the superiority of our approach over existing methods and
demonstrate that it can empower deeper insights into cellular heterogeneity and
the identification of disease cell states.
- Abstract(参考訳): 本稿では,不必要な変数や乱れに条件付き不変な表現を学習するために,ドメインの可変性を活用する新しい手法を提案する。
本手法は,潜伏特徴に条件付き事前設定を施し,正確な再構築を実現するために必要なスプリアスと不変潜伏特徴を同定する。
不変信号は、因果意味を持つ解釈可能なモデルの構築を容易にする独立性を強制することによってノイズから切り離される。
データドメインとラベル間の相互作用を利用して、不変な特徴を同時に識別し、不変な予測器を構築する。
異なる条件や複数の研究室から得られた多数のサンプルを含むデータセット間での生物学的変異を捉えることを目的として,単細胞ゲノミクスにおけるデータ統合のような壮大な生物学的課題に本手法を適用した。
我々のアプローチは、遺伝子プログラム、疾患状態、または治療条件を含む特定の生物学的メカニズムをデータ統合プロセスに組み込むことを可能にし、理論的な仮定と実際の生物学的応用のギャップを埋める。
特に、提案手法は、対象タスクや関心の因果説明と無関係なデータバイアスから生物学的シグナルを分離するのに役立つ。
大規模ヒト造血器とヒト肺がんデータを用いて広範なベンチマークを行い,既存の方法よりも優れたアプローチを検証し,細胞多様性や疾患細胞状態の同定に深い洞察を与えることができることを実証した。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Modelling Technical and Biological Effects in scRNA-seq data with
Scalable GPLVMs [6.708052194104378]
我々は,ガウス過程潜在変数モデルである確率的非線形次元減少に対する一般的なアプローチを拡張し,大規模単一セルデータセットに拡張する。
鍵となる考え方は、高速な変動推論を可能にする下位境界の分解可能性を保存する拡張カーネルを使用することである。
論文 参考訳(メタデータ) (2022-09-14T15:25:15Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Encoding Domain Information with Sparse Priors for Inferring Explainable
Latent Variables [2.8935588665357077]
説明可能な因子の推論を促進するために,スパース先行の因子潜在変数モデルであるspex-LVMを提案する。
spex-LVMは、既存の生物医療経路の知識を利用して、潜在因子にアノテート属性を自動的に割り当てる。
シミュレーションおよび実シングルセルRNA-seqデータセットの評価は、本モデルが本質的に説明可能な方法で関連構造を頑健に識別することを示す。
論文 参考訳(メタデータ) (2021-07-08T10:19:32Z) - Distinguishing Cell Phenotype Using Cell Epigenotype [0.0]
顕微鏡観察とマクロな振る舞いの関係は、生体物理学システムにおける根本的なオープンな問題である。
既存の手法とは対照的に,ヒトの組織多様性と利用可能なデータの制限を考慮に入れた場合でも,マクロ分子データから細胞型を予測する統一的なアプローチを開発する。
論文 参考訳(メタデータ) (2020-03-20T18:00:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。