論文の概要: eDOC: Explainable Decoding Out-of-domain Cell Types with Evidential Learning
- arxiv url: http://arxiv.org/abs/2411.00054v1
- Date: Wed, 30 Oct 2024 20:15:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:49:27.934518
- Title: eDOC: Explainable Decoding Out-of-domain Cell Types with Evidential Learning
- Title(参考訳): eDOC: 証拠学習を用いた説明可能なドメイン外のデコード
- Authors: Chaochen Wu, Meiyun Zuo, Lei Xie,
- Abstract要約: 単細胞RNA-seq(scRNA-seq)技術は生物学的システムの複雑さを解明するための強力なツールである。
CTA(Cell Type CTA)は、scRNA-seqデータ解析において必須かつ基本的なタスクの1つである。
上記の課題に対処する新しい手法であるeDOCを開発した。
- 参考スコア(独自算出の注目度): 7.036161839497915
- License:
- Abstract: Single-cell RNA-seq (scRNA-seq) technology is a powerful tool for unraveling the complexity of biological systems. One of essential and fundamental tasks in scRNA-seq data analysis is Cell Type Annotation (CTA). In spite of tremendous efforts in developing machine learning methods for this problem, several challenges remains. They include identifying Out-of-Domain (OOD) cell types, quantifying the uncertainty of unseen cell type annotations, and determining interpretable cell type-specific gene drivers for an OOD case. OOD cell types are often associated with therapeutic responses and disease origins, making them critical for precision medicine and early disease diagnosis. Additionally, scRNA-seq data contains tens thousands of gene expressions. Pinpointing gene drivers underlying CTA can provide deep insight into gene regulatory mechanisms and serve as disease biomarkers. In this study, we develop a new method, eDOC, to address aforementioned challenges. eDOC leverages a transformer architecture with evidential learning to annotate In-Domain (IND) and OOD cell types as well as to highlight genes that contribute both IND cells and OOD cells in a single cell resolution. Rigorous experiments demonstrate that eDOC significantly improves the efficiency and effectiveness of OOD cell type and gene driver identification compared to other state-of-the-art methods. Our findings suggest that eDOC may provide new insights into single-cell biology.
- Abstract(参考訳): 単細胞RNA-seq(scRNA-seq)技術は生物学的システムの複雑さを解明するための強力なツールである。
scRNA-seqデータ解析において必須かつ基本的なタスクの1つは、Cell Type Annotation (CTA)である。
この問題に対する機械学習手法の開発に多大な努力を払っているにもかかわらず、いくつかの課題が残っている。
それらは、Out-of-Domain(OOD)細胞タイプを特定し、未確認の細胞タイプアノテーションの不確実性を定量化し、OODケースの解釈可能な細胞タイプ固有の遺伝子ドライバを決定することを含む。
OOD細胞型は、しばしば治療反応や疾患の起源と関連付けられ、精密な医療や早期疾患の診断に重要である。
さらに、scRNA-seq データには数万の遺伝子発現が含まれている。
CTAの根底にあるピンポイント遺伝子ドライバは、遺伝子制御機構の深い洞察を与え、病気のバイオマーカーとして機能する。
本研究では,上記の課題に対処する新しい手法であるeDOCを開発した。
eDOCは、明らかな学習を伴うトランスフォーマーアーキテクチャを活用して、In-Domain(IND)とOOD細胞タイプをアノテートし、単一の細胞分解能でIND細胞とOOD細胞の両方に寄与する遺伝子を強調する。
厳密な実験により、eDOCはOOD細胞型および遺伝子ドライバ同定の効率と効果を、他の最先端の方法と比較して著しく改善することが示された。
以上の結果から,eDOCは単細胞生物学に新たな洞察を与える可能性が示唆された。
関連論文リスト
- Gene Regulatory Network Inference from Pre-trained Single-Cell Transcriptomics Transformer with Joint Graph Learning [10.44434676119443]
単一細胞RNAシークエンシング(scRNA-seq)データから遺伝子制御ネットワーク(GRN)を推定することは複雑である。
本研究では,単一セルBERTを用いた事前学習型トランスモデル(scBERT)を活用することで,この問題に対処する。
本稿では,単一セル言語モデルによって学習されたリッチな文脈表現と,GRNで符号化された構造化知識を組み合わせた,新しい共同グラフ学習手法を提案する。
論文 参考訳(メタデータ) (2024-07-25T16:42:08Z) - CRISPR-GPT: An LLM Agent for Automated Design of Gene-Editing Experiments [51.41735920759667]
大規模言語モデル(LLM)は様々なタスクにおいて有望であるが、しばしば特定の知識が欠如し、生物学的設計の問題を正確に解くのに苦労する。
本研究では,CRISPRに基づく遺伝子編集実験の設計プロセスを自動化するために,ドメイン知識と外部ツールを付加したLCMエージェントであるCRISPR-GPTを紹介する。
論文 参考訳(メタデータ) (2024-04-27T22:59:17Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - N-ACT: An Interpretable Deep Learning Model for Automatic Cell Type and
Salient Gene Identification [0.0]
ほとんどのscRNAseq解析パイプラインにおける大きな制限は、細胞のアイデンティティを決定するために手動のアノテーションに依存することである。
N-ACTは、ニューラルアテンションを利用して細胞型同定に使用するサルエント遺伝子を検出するACTIのための、第一級の解釈可能なディープニューラルネットワークである。
論文 参考訳(メタデータ) (2022-05-08T18:13:28Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Active feature selection discovers minimal gene-sets for classifying
cell-types and disease states in single-cell mRNA-seq data [2.578242050187029]
現在、単細胞mRNA-seqコストは、多くの生物学的および臨床的タスクに対する単細胞mRNA-seqの適用を禁止している。
本稿では, 細胞型と生理状態の高精度な分類を可能にする, 圧縮された遺伝子セットを構成する能動的学習フレームワークを提案する。
コンパクトだが高情報性の高い遺伝子セットの発見は、単一細胞mRNA-seqの応用に対するシークエンシング要求の劇的な削減を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-06-15T17:49:26Z) - A Cross-Level Information Transmission Network for Predicting Phenotype
from New Genotype: Application to Cancer Precision Medicine [37.442717660492384]
本稿では,CLEIT(Cross-Level Information Transmission Network)フレームワークを提案する。
ドメイン適応にインスパイアされたCLEITは、まずハイレベルドメインの潜在表現を学び、その後、接地木埋め込みとして利用する。
体細胞突然変異による抗がん剤感受性の予測におけるCLEITの有効性と性能の向上を示す。
論文 参考訳(メタデータ) (2020-10-09T22:01:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。