論文の概要: Mixed Effects Deep Learning Autoencoder for interpretable analysis of single cell RNA Sequencing data
- arxiv url: http://arxiv.org/abs/2411.06635v1
- Date: Mon, 11 Nov 2024 00:10:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:07:33.797184
- Title: Mixed Effects Deep Learning Autoencoder for interpretable analysis of single cell RNA Sequencing data
- Title(参考訳): 単一細胞RNAシークエンシングデータの解釈可能な解析のための混合効果ディープラーニングオートエンコーダ
- Authors: Aixa X. Andrade, Son Nguyen, Albert Montillo,
- Abstract要約: 単細胞RNAシークエンシング(scRNA-seq)データは、技術的または生物学的なバッチ効果により、しばしば融合される。
既存のディープラーニングモデルは、これらの効果を軽減することを目的としているが、バッチ固有の情報を必然的に破棄する可能性がある。
本稿では、バッチ不変(固定効果)とバッチ固有(ランダム効果)を別々にモデル化した、MEDL(Mixed Effects Deep Learning)オートエンコーダフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.596656267996196
- License:
- Abstract: Single-cell RNA sequencing (scRNA-seq) data are often confounded due to technical or biological batch effects. Existing deep learning models aim to mitigate these effects but may inadvertently discard batch-specific information. We propose a Mixed Effects Deep Learning (MEDL) Autoencoder framework that separately models batch-invariant (fixed effects) and batch-specific (random effects) components. By decoupling fixed effects representing biological states from random effects capturing batch-specific variations, MEDL integrates both types of information into predictive models, minimizing information loss. This approach improves interpretability enabling 2D visualizations that show how the same cell would appear across different batches, facilitating exploration of batch-specific variations. We applied MEDL to three datasets: Healthy Heart, Autism Spectrum Disorder (ASDc), and Acute Myeloid Leukemia (AML). In Healthy Heart, MEDL managed 147 batches, assessing its capacity to handle high batch numbers. In ASDc, MEDL captured donor heterogeneity between autistic and healthy individuals, while in AML, it distinguished heterogeneity in a complex setting with variable cell-type presence and malignant cells in diseased donors. These applications demonstrate MEDL's potential to capture fixed and random effects, improve visualization, and enhance predictive accuracy, offering a robust framework for cellular heterogeneity analysis across diverse datasets.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)データは、技術的または生物学的なバッチ効果により、しばしば融合される。
既存のディープラーニングモデルは、これらの効果を軽減することを目的としているが、バッチ固有の情報を必然的に破棄する可能性がある。
本稿では、バッチ不変(固定効果)とバッチ固有(ランダム効果)を別々にモデル化した、MEDL(Mixed Effects Deep Learning)オートエンコーダフレームワークを提案する。
バッチ固有のバリエーションをキャプチャするランダムな効果から生物学的状態を表す固定効果を分離することにより、MEDLは両方の種類の情報を予測モデルに統合し、情報損失を最小限に抑える。
このアプローチは、異なるバッチ間で同じセルがどのように現れるかを示す2D視覚化を可能にする解釈可能性を改善し、バッチ固有のバリエーションの探索を容易にする。
MEDLを健常心,自閉症スペクトラム障害(ASDc),急性骨髄性白血病(AML)の3つのデータセットに適用した。
Healthy Heartでは、MEDLは147バッチを管理し、高いバッチ数を扱う能力を評価した。
ASDcでは、MEDLは自閉症患者と健常者の間のドナー不均一性を捉え、AMLでは、変異細胞型の存在と疾患ドナーの悪性細胞との複雑な環境で不均一性を区別した。
これらのアプリケーションは、固定効果とランダム効果をキャプチャし、視覚化を改善し、予測精度を向上させるMEDLの可能性を示し、多様なデータセットをまたいだ細胞不均一性分析のための堅牢なフレームワークを提供する。
関連論文リスト
- Predicting Drug Effects from High-Dimensional, Asymmetric Drug Datasets by Using Graph Neural Networks: A Comprehensive Analysis of Multitarget Drug Effect Prediction [1.1970409518725493]
グラフニューラルネットワーク(GNN)は、薬物分子グラフから薬物効果を予測する最も効果的なML手法の1つである。
膨大な可能性を秘めているにもかかわらず、GNNモデルは高次元、非対称的に共起する薬物効果を含むデータセットを使用する際の性能を欠いている。
そこで本稿では, 与えられた不均衡な分子グラフデータセットの多重ラベル分類性能を改善するために, 新たなデータオーバーサンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T22:09:29Z) - Scalable Amortized GPLVMs for Single Cell Transcriptomics Data [9.010523724015398]
大規模単細胞RNA-seqデータの解析には次元化が不可欠である。
改良されたモデル、償却変分モデル(BGPLVM)を導入する。
BGPLVMは、特殊なエンコーダ、カーネル、そして可能性設計を備えたシングルセルRNA-seq向けに調整されている。
論文 参考訳(メタデータ) (2024-05-06T21:54:38Z) - sc-OTGM: Single-Cell Perturbation Modeling by Solving Optimal Mass Transport on the Manifold of Gaussian Mixtures [0.9674145073701153]
sc-OTGMは、scRNAseqデータが生成される誘導バイアスに基づく教師なしモデルである。
sc-OTGMは細胞状態の分類、異なる遺伝子発現の解析、標的同定のための遺伝子ランキングに有効である。
また、下流遺伝子制御に対する単一遺伝子の摂動の影響を予測し、特定の細胞状態に条件付けられた合成scRNA-seqデータを生成する。
論文 参考訳(メタデータ) (2024-05-06T06:46:11Z) - Interpretable cancer cell detection with phonon microscopy using multi-task conditional neural networks for inter-batch calibration [39.759100498329275]
本稿では,バッチ間キャリブレーションを同時に実現する条件付きニューラルネットワークフレームワークを提案する。
異なる実験バッチをトレーニングし、検証することで、我々のアプローチを検証する。
このモデルを拡張して, 診断信号の再構成を行い, 疾患状態を示す有能な特徴の物理的解釈を可能にした。
論文 参考訳(メタデータ) (2024-03-26T12:20:10Z) - Removing Biases from Molecular Representations via Information
Maximization [16.38589836748167]
InfoCOREは、COnfounder Removalがバッチ効果を扱うための情報アプローチである。
インプリートされたバッチ分布を等化するために、サンプルを適応的にリウィージする。
汎用的なフレームワークを提供し、データ公平性の一般的な分散シフトと課題を解決する。
論文 参考訳(メタデータ) (2023-12-01T16:53:15Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。