論文の概要: Mixed Effects Deep Learning for the interpretable analysis of single cell RNA sequencing data by quantifying and visualizing batch effects
- arxiv url: http://arxiv.org/abs/2411.06635v2
- Date: Wed, 13 Nov 2024 21:20:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-15 11:44:42.959021
- Title: Mixed Effects Deep Learning for the interpretable analysis of single cell RNA sequencing data by quantifying and visualizing batch effects
- Title(参考訳): バッチ効果の定量化と可視化による単一細胞RNAシークエンシングデータの解釈可能な解析のための混合効果深層学習
- Authors: Aixa X. Andrade, Son Nguyen, Albert Montillo,
- Abstract要約: シングルセルRNAシークエンシング(scRNA-seq)データは、しばしば技術的または生物学的バッチ効果によって構築される。
既存のディープラーニングモデルはこれらの効果を緩和するが、バッチ固有の情報を捨てることが多い。
本稿では,バッチ不変量(固定効果)とバッチ固有量(ランダム効果)を別々にモデル化したMEDL自動エンコーダフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.596656267996196
- License:
- Abstract: Single-cell RNA sequencing (scRNA-seq) data are often confounded by technical or biological batch effects. Existing deep learning models mitigate these effects but often discard batch-specific information, potentially losing valuable biological insights. We propose a Mixed Effects Deep Learning (MEDL) autoencoder framework that separately models batch-invariant (fixed effects) and batch-specific (random effects) components. By decoupling batch-invariant biological states from batch variations, our framework integrates both into predictive models. Our approach also generates 2D visualizations of how the same cell appears across batches, enhancing interpretability. Retaining both fixed and random effect latent spaces improves classification accuracy. We applied our framework to three datasets spanning the cardiovascular system (Healthy Heart), Autism Spectrum Disorder (ASD), and Acute Myeloid Leukemia (AML). With 147 batches in the Healthy Heart dataset, far exceeding typical numbers, we tested our framework's ability to handle many batches. In the ASD dataset, our approach captured donor heterogeneity between autistic and healthy individuals. In the AML dataset, it distinguished donor heterogeneity despite missing cell types and diseased donors exhibiting both healthy and malignant cells. These results highlight our framework's ability to characterize fixed and random effects, enhance batch effect visualization, and improve prediction accuracy across diverse datasets.
- Abstract(参考訳): シングルセルRNAシークエンシング(scRNA-seq)データは、しばしば技術的または生物学的バッチ効果によって構築される。
既存のディープラーニングモデルはこれらの効果を緩和するが、しばしばバッチ固有の情報を破棄し、貴重な生物学的洞察を失う可能性がある。
本稿では,バッチ不変量(固定効果)とバッチ固有量(ランダム効果)を別々にモデル化したMEDL自動エンコーダフレームワークを提案する。
バッチ不変な生物学的状態をバッチのバリエーションから切り離すことによって、私たちのフレームワークは予測モデルの両方に統合されます。
このアプローチはまた、バッチ間で同じ細胞がどのように見えるかの2次元可視化も生成し、解釈可能性を高める。
固定効果空間とランダム効果ラテント空間の両方を保持することにより、分類精度が向上する。
心血管系(健康心臓)、自閉症スペクトラム障害(ASD)、急性骨髄性白血病(AML)の3つのデータセットに適用した。
Healthy Heartデータセットの147バッチは、一般的な数字をはるかに超えて、多くのバッチを処理するフレームワークの能力をテストしました。
ASDデータセットでは,自閉症と健常者のドナー不均一性を抽出した。
AMLデータセットでは、正常な細胞と悪性な細胞の両方を示す細胞型と疾患ドナーの欠如にもかかわらず、ドナーの不均一性を区別した。
これらの結果は、固定効果とランダム効果を特徴づけ、バッチ効果の可視化を強化し、多様なデータセットの予測精度を向上させるフレームワークの能力を強調している。
関連論文リスト
- Predicting Drug Effects from High-Dimensional, Asymmetric Drug Datasets by Using Graph Neural Networks: A Comprehensive Analysis of Multitarget Drug Effect Prediction [1.1970409518725493]
グラフニューラルネットワーク(GNN)は、薬物分子グラフから薬物効果を予測する最も効果的なML手法の1つである。
膨大な可能性を秘めているにもかかわらず、GNNモデルは高次元、非対称的に共起する薬物効果を含むデータセットを使用する際の性能を欠いている。
そこで本稿では, 与えられた不均衡な分子グラフデータセットの多重ラベル分類性能を改善するために, 新たなデータオーバーサンプリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-11T22:09:29Z) - Interpretable cancer cell detection with phonon microscopy using multi-task conditional neural networks for inter-batch calibration [39.759100498329275]
本稿では,バッチ間キャリブレーションを同時に実現する条件付きニューラルネットワークフレームワークを提案する。
異なる実験バッチをトレーニングし、検証することで、我々のアプローチを検証する。
このモデルを拡張して, 診断信号の再構成を行い, 疾患状態を示す有能な特徴の物理的解釈を可能にした。
論文 参考訳(メタデータ) (2024-03-26T12:20:10Z) - Few-shot learning for COVID-19 Chest X-Ray Classification with
Imbalanced Data: An Inter vs. Intra Domain Study [49.5374512525016]
医療画像データセットは、コンピュータ支援診断、治療計画、医学研究に使用される訓練モデルに不可欠である。
データ分散のばらつき、データの不足、ジェネリックイメージから事前トレーニングされたモデルを使用する場合の転送学習の問題などである。
本稿では,データ不足と分散不均衡の影響を軽減するために,一連の手法を統合したシームズニューラルネットワークに基づく手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T16:59:27Z) - Removing Biases from Molecular Representations via Information
Maximization [16.38589836748167]
InfoCOREは、COnfounder Removalがバッチ効果を扱うための情報アプローチである。
インプリートされたバッチ分布を等化するために、サンプルを適応的にリウィージする。
汎用的なフレームワークを提供し、データ公平性の一般的な分散シフトと課題を解決する。
論文 参考訳(メタデータ) (2023-12-01T16:53:15Z) - STEM Rebalance: A Novel Approach for Tackling Imbalanced Datasets using
SMOTE, Edited Nearest Neighbour, and Mixup [0.20482269513546458]
医用画像における非バランスなデータセットは、スクイードクラスの割合と異常な症例の不足によって特徴づけられる。
本稿では,Mixup Augmentation を用いて新たなデータポイントを汎用的なビジナル分布として生成する可能性について検討する。
不均衡なデータセットが一般的である乳癌の問題に焦点をあてる。
論文 参考訳(メタデータ) (2023-11-13T17:45:28Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - A Causal Framework for Decomposing Spurious Variations [68.12191782657437]
我々はマルコフモデルとセミマルコフモデルの急激な変分を分解するツールを開発する。
突発効果の非パラメトリック分解を可能にする最初の結果を証明する。
説明可能なAIや公平なAIから、疫学や医学における疑問まで、いくつかの応用がある。
論文 参考訳(メタデータ) (2023-06-08T09:40:28Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。