論文の概要: Conditionally Invariant Representation Learning for Disentangling
Cellular Heterogeneity
- arxiv url: http://arxiv.org/abs/2307.00558v1
- Date: Sun, 2 Jul 2023 12:52:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-05 15:27:57.502024
- Title: Conditionally Invariant Representation Learning for Disentangling
Cellular Heterogeneity
- Title(参考訳): 異なるセル不均一性のための条件不変表現学習
- Authors: Hananeh Aliee, Ferdinand Kapl, Soroor Hediyeh-Zadeh, Fabian J. Theis
- Abstract要約: 本稿では,不必要な変数や乱れに条件付き不変な表現を学習するために,ドメインの可変性を活用する新しい手法を提案する。
単細胞ゲノム学におけるデータ統合など,生物の課題に対して本手法を適用した。
具体的には、提案手法は、対象のタスクと無関係なデータバイアスや興味の因果的説明から生物学的信号を解き放つのに役立つ。
- 参考スコア(独自算出の注目度): 25.488181126364186
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel approach that leverages domain variability to
learn representations that are conditionally invariant to unwanted variability
or distractors. Our approach identifies both spurious and invariant latent
features necessary for achieving accurate reconstruction by placing distinct
conditional priors on latent features. The invariant signals are disentangled
from noise by enforcing independence which facilitates the construction of an
interpretable model with a causal semantic. By exploiting the interplay between
data domains and labels, our method simultaneously identifies invariant
features and builds invariant predictors. We apply our method to grand
biological challenges, such as data integration in single-cell genomics with
the aim of capturing biological variations across datasets with many samples,
obtained from different conditions or multiple laboratories. Our approach
allows for the incorporation of specific biological mechanisms, including gene
programs, disease states, or treatment conditions into the data integration
process, bridging the gap between the theoretical assumptions and real
biological applications. Specifically, the proposed approach helps to
disentangle biological signals from data biases that are unrelated to the
target task or the causal explanation of interest. Through extensive
benchmarking using large-scale human hematopoiesis and human lung cancer data,
we validate the superiority of our approach over existing methods and
demonstrate that it can empower deeper insights into cellular heterogeneity and
the identification of disease cell states.
- Abstract(参考訳): 本稿では,不必要な変数や乱れに条件付き不変な表現を学習するために,ドメインの可変性を活用する新しい手法を提案する。
本手法は,潜伏特徴に条件付き事前設定を施し,正確な再構築を実現するために必要なスプリアスと不変潜伏特徴を同定する。
不変信号は、因果意味を持つ解釈可能なモデルの構築を容易にする独立性を強制することによってノイズから切り離される。
データドメインとラベル間の相互作用を利用して、不変な特徴を同時に識別し、不変な予測器を構築する。
異なる条件や複数の研究室から得られた多数のサンプルを含むデータセット間での生物学的変異を捉えることを目的として,単細胞ゲノミクスにおけるデータ統合のような壮大な生物学的課題に本手法を適用した。
我々のアプローチは、遺伝子プログラム、疾患状態、または治療条件を含む特定の生物学的メカニズムをデータ統合プロセスに組み込むことを可能にし、理論的な仮定と実際の生物学的応用のギャップを埋める。
特に、提案手法は、対象タスクや関心の因果説明と無関係なデータバイアスから生物学的シグナルを分離するのに役立つ。
大規模ヒト造血器とヒト肺がんデータを用いて広範なベンチマークを行い,既存の方法よりも優れたアプローチを検証し,細胞多様性や疾患細胞状態の同定に深い洞察を与えることができることを実証した。
関連論文リスト
- Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Revisiting Adaptive Cellular Recognition Under Domain Shifts: A Contextual Correspondence View [49.03501451546763]
生物学的文脈における暗黙の対応の重要性を明らかにする。
モデル構成成分間のインスタンス認識トレードオフを確保するために, 自己適応型動的蒸留を提案する。
論文 参考訳(メタデータ) (2024-07-14T04:41:16Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Domain adaptation in small-scale and heterogeneous biological datasets [0.0]
生物研究におけるドメイン適応のメリットと課題について論じる。
計算生物学者のツールキットにドメイン適応技術を導入することについて論じる。
論文 参考訳(メタデータ) (2024-05-29T16:01:15Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Encoding Domain Information with Sparse Priors for Inferring Explainable
Latent Variables [2.8935588665357077]
説明可能な因子の推論を促進するために,スパース先行の因子潜在変数モデルであるspex-LVMを提案する。
spex-LVMは、既存の生物医療経路の知識を利用して、潜在因子にアノテート属性を自動的に割り当てる。
シミュレーションおよび実シングルセルRNA-seqデータセットの評価は、本モデルが本質的に説明可能な方法で関連構造を頑健に識別することを示す。
論文 参考訳(メタデータ) (2021-07-08T10:19:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。