論文の概要: Bipartite Graph Attention-based Clustering for Large-scale scRNA-seq Data
- arxiv url: http://arxiv.org/abs/2602.07475v1
- Date: Sat, 07 Feb 2026 10:10:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.642064
- Title: Bipartite Graph Attention-based Clustering for Large-scale scRNA-seq Data
- Title(参考訳): 大規模scRNA-seqデータのための2部グラフアテンションに基づくクラスタリング
- Authors: Zhuomin Liang, Liang Bai, Xian Yang,
- Abstract要約: グラフトランスフォーマーベースのモデルのような既存のscRNA-seqクラスタリングの方法は、各セルをシーケンス内のトークンとして扱う。
そこで本研究では,ScRNA-seqデータに対するBipartite Graph Transformerベースのクラスタリングモデルを提案する。
BGFormerは、セルの数に関して線形計算の複雑さを達成し、大規模なデータセットにスケーラブルにする。
- 参考スコア(独自算出の注目度): 12.341331216251582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: scRNA-seq clustering is a critical task for analyzing single-cell RNA sequencing (scRNA-seq) data, as it groups cells with similar gene expression profiles. Transformers, as powerful foundational models, have been applied to scRNA-seq clustering. Their self-attention mechanism automatically assigns higher attention weights to cells within the same cluster, enhancing the distinction between clusters. Existing methods for scRNA-seq clustering, such as graph transformer-based models, treat each cell as a token in a sequence. Their computational and space complexities are $\mathcal{O}(n^2)$ with respect to the number of cells, limiting their applicability to large-scale scRNA-seq datasets.To address this challenge, we propose a Bipartite Graph Transformer-based clustering model (BGFormer) for scRNA-seq data. We introduce a set of learnable anchor tokens as shared reference points to represent the entire dataset. A bipartite graph attention mechanism is introduced to learn the similarity between cells and anchor tokens, bringing cells of the same class closer together in the embedding space. BGFormer achieves linear computational complexity with respect to the number of cells, making it scalable to large datasets. Experimental results on multiple large-scale scRNA-seq datasets demonstrate the effectiveness and scalability of BGFormer.
- Abstract(参考訳): scRNA-seqクラスタリングは単細胞RNAシークエンシング(scRNA-seq)データを解析するための重要なタスクである。
トランスフォーマーは、強力な基礎モデルとして、scRNA-seqクラスタリングに適用されている。
彼らの自己保持機構は、自動的に同じクラスタ内の細胞に高い注意重みを割り当て、クラスタ間の区別を高める。
グラフトランスフォーマーベースのモデルのような既存のscRNA-seqクラスタリングの方法は、各セルをシーケンス内のトークンとして扱う。
計算量と空間の複雑さはセル数に対して$\mathcal{O}(n^2)$であり、大規模なscRNA-seqデータセットに適用可能であり、この問題に対処するために、scRNA-seqデータに対するBipartite Graph Transformerベースのクラスタリングモデル(BGFormer)を提案する。
データセット全体を表すために、共有参照ポイントとして学習可能なアンカートークンのセットを導入します。
細胞とアンカートークンの類似性を学ぶために、二部グラフアテンション機構を導入し、同じクラスの細胞を埋め込み空間に近づける。
BGFormerは、セルの数に関して線形計算の複雑さを達成し、大規模なデータセットにスケーラブルにする。
複数の大規模scRNA-seqデータセットの実験結果から,BGFormerの有効性とスケーラビリティが示された。
関連論文リスト
- Scalable Context-Preserving Model-Aware Deep Clustering for Hyperspectral Images [51.95768218975529]
ハイパースペクトル画像(HSI)の教師なし解析にサブスペースクラスタリングが広く採用されている。
近年のモデル対応深層空間クラスタリング手法では、O(n2)の複雑性を持つ自己表現行列の計算とスペクトルクラスタリングを含む2段階のフレームワークを用いることが多い。
本稿では,HSIクラスタリングを効率的に行うために,局所構造と非局所構造を協調的にキャプチャする,ベース表現に基づく拡張性のあるコンテキスト保存深層クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2025-06-12T16:43:09Z) - scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data [33.191442026962186]
単細胞RNAシークエンシング(scRNA-seq)は細胞不均一性を示す。
細胞クラスタリングは、細胞タイプとマーカー遺伝子の同定において重要な役割を担っている。
グラフニューラルネットワーク(GNN)ベースの手法はクラスタリング性能を大幅に改善した。
scSiameseCluはシングルセルRNA-seqデータを解釈するための新しいフレームワークである。
論文 参考訳(メタデータ) (2025-05-19T02:17:09Z) - scASDC: Attention Enhanced Structural Deep Clustering for Single-cell RNA-seq Data [5.234149080137045]
scRNA-seqデータに固有の高空間性および複雑なノイズパターンは、従来のクラスタリング手法において重要な課題である。
本稿では,深層クラスタリング手法であるアテンション強化構造深層埋め込みグラフクラスタリング(scASDC)を提案する。
scASDCはクラスタリングの精度と堅牢性を改善するために、複数の高度なモジュールを統合している。
論文 参考訳(メタデータ) (2024-08-09T09:10:36Z) - scRNA-seq Data Clustering by Cluster-aware Iterative Contrastive
Learning [29.199004624757233]
単一細胞RNAシークエンシング(scRNA-seq)により、研究者は単一細胞レベルで遺伝子発現を解析できる。
scRNA-seqデータ分析における重要なタスクは、教師なしクラスタリングである。
我々は,cRNA-seqデータクラスタリングのためのクラスタ対応反復コントラスト学習(CICL)を提案する。
論文 参考訳(メタデータ) (2023-12-27T14:50:59Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.31109141089598]
シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文 参考訳(メタデータ) (2023-11-28T08:34:58Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。