論文の概要: Mixed Effects Deep Learning Autoencoder for interpretable analysis of single cell RNA Sequencing data
- arxiv url: http://arxiv.org/abs/2411.06635v1
- Date: Mon, 11 Nov 2024 00:10:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-12 14:07:33.797184
- Title: Mixed Effects Deep Learning Autoencoder for interpretable analysis of single cell RNA Sequencing data
- Title(参考訳): 単一細胞RNAシークエンシングデータの解釈可能な解析のための混合効果ディープラーニングオートエンコーダ
- Authors: Aixa X. Andrade, Son Nguyen, Albert Montillo,
- Abstract要約: 単細胞RNAシークエンシング(scRNA-seq)データは、技術的または生物学的なバッチ効果により、しばしば融合される。
既存のディープラーニングモデルは、これらの効果を軽減することを目的としているが、バッチ固有の情報を必然的に破棄する可能性がある。
本稿では、バッチ不変(固定効果)とバッチ固有(ランダム効果)を別々にモデル化した、MEDL(Mixed Effects Deep Learning)オートエンコーダフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.596656267996196
- License:
- Abstract: Single-cell RNA sequencing (scRNA-seq) data are often confounded due to technical or biological batch effects. Existing deep learning models aim to mitigate these effects but may inadvertently discard batch-specific information. We propose a Mixed Effects Deep Learning (MEDL) Autoencoder framework that separately models batch-invariant (fixed effects) and batch-specific (random effects) components. By decoupling fixed effects representing biological states from random effects capturing batch-specific variations, MEDL integrates both types of information into predictive models, minimizing information loss. This approach improves interpretability enabling 2D visualizations that show how the same cell would appear across different batches, facilitating exploration of batch-specific variations. We applied MEDL to three datasets: Healthy Heart, Autism Spectrum Disorder (ASDc), and Acute Myeloid Leukemia (AML). In Healthy Heart, MEDL managed 147 batches, assessing its capacity to handle high batch numbers. In ASDc, MEDL captured donor heterogeneity between autistic and healthy individuals, while in AML, it distinguished heterogeneity in a complex setting with variable cell-type presence and malignant cells in diseased donors. These applications demonstrate MEDL's potential to capture fixed and random effects, improve visualization, and enhance predictive accuracy, offering a robust framework for cellular heterogeneity analysis across diverse datasets.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)データは、技術的または生物学的なバッチ効果により、しばしば融合される。
既存のディープラーニングモデルは、これらの効果を軽減することを目的としているが、バッチ固有の情報を必然的に破棄する可能性がある。
本稿では、バッチ不変(固定効果)とバッチ固有(ランダム効果)を別々にモデル化した、MEDL(Mixed Effects Deep Learning)オートエンコーダフレームワークを提案する。
バッチ固有のバリエーションをキャプチャするランダムな効果から生物学的状態を表す固定効果を分離することにより、MEDLは両方の種類の情報を予測モデルに統合し、情報損失を最小限に抑える。
このアプローチは、異なるバッチ間で同じセルがどのように現れるかを示す2D視覚化を可能にする解釈可能性を改善し、バッチ固有のバリエーションの探索を容易にする。
MEDLを健常心,自閉症スペクトラム障害(ASDc),急性骨髄性白血病(AML)の3つのデータセットに適用した。
Healthy Heartでは、MEDLは147バッチを管理し、高いバッチ数を扱う能力を評価した。
ASDcでは、MEDLは自閉症患者と健常者の間のドナー不均一性を捉え、AMLでは、変異細胞型の存在と疾患ドナーの悪性細胞との複雑な環境で不均一性を区別した。
これらのアプリケーションは、固定効果とランダム効果をキャプチャし、視覚化を改善し、予測精度を向上させるMEDLの可能性を示し、多様なデータセットをまたいだ細胞不均一性分析のための堅牢なフレームワークを提供する。
関連論文リスト
- Predicting Drug Effects from High-Dimensional, Asymmetric Drug Datasets by Using Graph Neural Networks: A Comprehensive Analysis of Multitarget Drug Effect Prediction [1.1970409518725493]
グラフニューラルネットワーク(GNN)は、薬物分子グラフから薬物効果を予測する最も効果的なML手法の1つである。
膨大な可能性を秘めているにもかかわらず、GNNモデルは高次元、非対称的に共起する薬物効果を含むデータセットを使用する際の性能を欠いている。
そこで本稿では, 与えられた不均衡な分子グラフデータセットの多重ラベル分類性能を改善するために, 新たなデータオーバーサンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T22:09:29Z) - Interpretable cancer cell detection with phonon microscopy using multi-task conditional neural networks for inter-batch calibration [39.759100498329275]
本稿では,バッチ間キャリブレーションを同時に実現する条件付きニューラルネットワークフレームワークを提案する。
異なる実験バッチをトレーニングし、検証することで、我々のアプローチを検証する。
このモデルを拡張して, 診断信号の再構成を行い, 疾患状態を示す有能な特徴の物理的解釈を可能にした。
論文 参考訳(メタデータ) (2024-03-26T12:20:10Z) - Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study [49.5374512525016]
医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T16:59:27Z) - Removing Biases from Molecular Representations via Information
Maximization [16.38589836748167]
InfoCOREは、COnfounder Removalがバッチ効果を扱うための情報アプローチである。
インプリートされたバッチ分布を等化するために、サンプルを適応的にリウィージする。
汎用的なフレームワークを提供し、データ公平性の一般的な分散シフトと課題を解決する。
論文 参考訳(メタデータ) (2023-12-01T16:53:15Z) - STEM Rebalance: A Novel Approach for Tackling Imbalanced Datasets using
SMOTE, Edited Nearest Neighbour, and Mixup [0.20482269513546458]
医用画像における非バランスなデータセットは、スクイードクラスの割合と異常な症例の不足によって特徴づけられる。
本稿では,Mixup Augmentation を用いて新たなデータポイントを汎用的なビジナル分布として生成する可能性について検討する。
不均衡なデータセットが一般的である乳癌の問題に焦点をあてる。
論文 参考訳(メタデータ) (2023-11-13T17:45:28Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。