論文の概要: GRIT: Graph-Regularized Logit Refinement for Zero-shot Cell Type Annotation
- arxiv url: http://arxiv.org/abs/2508.04747v1
- Date: Wed, 06 Aug 2025 07:09:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.589962
- Title: GRIT: Graph-Regularized Logit Refinement for Zero-shot Cell Type Annotation
- Title(参考訳): GRIT:ゼロショットセル型アノテーションのためのグラフ規則化ログリファインメント
- Authors: Tianxiang Hu, Chenyi Zhou, Jiaxiang Liu, Jiongxin Wang, Ruizhe Chen, Haoxiang Xia, Gaoang Wang, Jian Wu, Zuozhu Liu,
- Abstract要約: 細胞型アノテーションは単細胞RNAシークエンシング(scRNA-seq)データの解析における基本的なステップである。
CLIPスタイルモデルの最近の進歩は、細胞型アノテーションの自動化への有望な道を提供する。
本稿では,グラフ正規化最適化フレームワークを用いて,LangCellが生成するゼロショットロジットを改良することを提案する。
- 参考スコア(独自算出の注目度): 15.465706196179676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cell type annotation is a fundamental step in the analysis of single-cell RNA sequencing (scRNA-seq) data. In practice, human experts often rely on the structure revealed by principal component analysis (PCA) followed by $k$-nearest neighbor ($k$-NN) graph construction to guide annotation. While effective, this process is labor-intensive and does not scale to large datasets. Recent advances in CLIP-style models offer a promising path toward automating cell type annotation. By aligning scRNA-seq profiles with natural language descriptions, models like LangCell enable zero-shot annotation. While LangCell demonstrates decent zero-shot performance, its predictions remain suboptimal, particularly in achieving consistent accuracy across all cell types. In this paper, we propose to refine the zero-shot logits produced by LangCell through a graph-regularized optimization framework. By enforcing local consistency over the task-specific PCA-based k-NN graph, our method combines the scalability of the pre-trained models with the structural robustness relied upon in expert annotation. We evaluate our approach on 14 annotated human scRNA-seq datasets from 4 distinct studies, spanning 11 organs and over 200,000 single cells. Our method consistently improves zero-shot annotation accuracy, achieving accuracy gains of up to 10%. Further analysis showcase the mechanism by which GRIT effectively propagates correct signals through the graph, pulling back mislabeled cells toward more accurate predictions. The method is training-free, model-agnostic, and serves as a simple yet effective plug-in for enhancing automated cell type annotation in practice.
- Abstract(参考訳): 細胞型アノテーションは単細胞RNAシークエンシング(scRNA-seq)データの解析における基本的なステップである。
実際には、人間の専門家はしばしば、主成分分析(PCA)によって明らかにされた構造に依存し、その後、アノテーションを導くために$k$-nearest(k$-NN)グラフ構築が続く。
効果はあるものの、このプロセスは労働集約的であり、大規模なデータセットにスケールしない。
CLIPスタイルモデルの最近の進歩は、細胞型アノテーションの自動化への有望な道を提供する。
scRNA-seqプロファイルを自然言語記述に合わせることで、LangCellのようなモデルはゼロショットアノテーションを可能にする。
LangCellは、十分なゼロショット性能を示しているが、その予測は、特にすべてのセルタイプで一貫した精度を達成するために、最適以下である。
本稿では,グラフ正規化最適化フレームワークを用いて,LangCellが生成するゼロショットロジットを改良することを提案する。
タスク固有のPCAベースのk-NNグラフ上で局所的な一貫性を強制することにより、事前学習されたモデルのスケーラビリティと、専門家アノテーションに依存する構造的ロバスト性を組み合わせる。
我々は、11の臓器と20,000の単細胞にまたがる4つの異なる研究から、14の注釈付きヒトcRNA-seqデータセットに対するアプローチを評価した。
提案手法はゼロショットアノテーションの精度を常に向上し,最大10%の精度向上を実現している。
さらなる分析では、GRITがグラフを通して正しい信号を効果的に伝播し、間違ったラベル付き細胞をより正確な予測へと引き戻すメカニズムが示されている。
この方法は、トレーニング不要で、モデルに依存しないものであり、実際に自動化された細胞型アノテーションを強化するためのシンプルで効果的なプラグインとして機能する。
関連論文リスト
- Cell-o1: Training LLMs to Solve Single-Cell Reasoning Puzzles with Reinforcement Learning [44.91329557101423]
我々はCellPuzzlesタスクを導入し、その目的はセルのバッチにユニークなセルタイプを割り当てることである。
このベンチマークは、様々な組織、疾患、ドナーの状態にまたがっており、ラベルの独特性を保証するために、バッチレベルの細胞コンテキストをまたいで推論する必要がある。
蒸留液の微調整を施した7B LLMのCell-o1を提案する。
論文 参考訳(メタデータ) (2025-06-03T14:16:53Z) - Self-Boost via Optimal Retraining: An Analysis via Approximate Message Passing [58.52119063742121]
独自の予測と潜在的にノイズの多いラベルを使ってモデルをトレーニングすることは、モデルパフォーマンスを改善するためのよく知られた戦略である。
本稿では,モデルの予測と提供ラベルを最適に組み合わせる方法について論じる。
我々の主な貢献は、現在のモデルの予測と与えられたラベルを組み合わせたベイズ最適集約関数の導出である。
論文 参考訳(メタデータ) (2025-05-21T07:16:44Z) - ReCellTy: Domain-specific knowledge graph retrieval-augmented LLMs workflow for single-cell annotation [8.31906400360507]
細胞再構成のための差分遺伝子に関連付けられたエンティティを検索するためのグラフ構造化特徴マーカーデータベースを開発した。
本手法は,11種類の組織に対して,ヒトの評価スコアを最大0.21,意味的類似度を6.1%改善する。
論文 参考訳(メタデータ) (2025-04-24T01:05:22Z) - Benchmarking and optimizing organism wide single-cell RNA alignment methods [0.0]
K-Neighbors Intersection (KNI) スコアは,バッチ効果をペナライズし,セル型ラベル予測の精度を計測する単一スコアである。
本稿では,逆算学習を用いて,エンコーダとデコーダのバッチ効果をペナルライズするScVIの新たな変種として,Batch Adversarial Single-cell Variational Inference (BA-scVI)を紹介した。
得られたアライメント空間では, 細胞型グルーピングの粒度が保存され, 情報を失うことなく, 有機体型マップを単一モデルで作成できるという概念が支持される。
論文 参考訳(メタデータ) (2025-03-26T17:11:47Z) - Less is More: One-shot Subgraph Reasoning on Large-scale Knowledge Graphs [49.547988001231424]
効率的かつ適応的な予測を実現するために,ワンショットサブグラフリンク予測を提案する。
設計原理は、KG全体に直接作用する代わりに、予測手順を2つのステップに分離する。
5つの大規模ベンチマークにおいて,効率の向上と性能の向上を実現している。
論文 参考訳(メタデータ) (2024-03-15T12:00:12Z) - Cell Graph Transformer for Nuclei Classification [78.47566396839628]
我々は,ノードとエッジを入力トークンとして扱うセルグラフ変換器(CGT)を開発した。
不愉快な特徴は、騒々しい自己注意スコアと劣等な収束につながる可能性がある。
グラフ畳み込みネットワーク(GCN)を利用して特徴抽出器を学習する新しいトポロジ対応事前学習法を提案する。
論文 参考訳(メタデータ) (2024-02-20T12:01:30Z) - Efficient Heterogeneous Graph Learning via Random Projection [58.4138636866903]
不均一グラフニューラルネットワーク(HGNN)は、異種グラフを深層学習するための強力なツールである。
最近のプリ計算ベースのHGNNは、一時間メッセージパッシングを使用して不均一グラフを正規形テンソルに変換する。
我々はRandom Projection Heterogeneous Graph Neural Network (RpHGNN) というハイブリッド計算前HGNNを提案する。
論文 参考訳(メタデータ) (2023-10-23T01:25:44Z) - DeepGATGO: A Hierarchical Pretraining-Based Graph-Attention Model for
Automatic Protein Function Prediction [4.608328575930055]
自動タンパク質機能予測(AFP)は大規模多ラベル分類問題に分類される。
現在、一般的な手法は主にタンパク質関連情報と遺伝子オントロジー(GO)の用語を組み合わせて、最終的な機能予測を生成する。
本稿では,タンパク質配列とGO項ラベルを階層的に処理するシークエンスベースの階層予測手法であるDeepGATGOを提案する。
論文 参考訳(メタデータ) (2023-07-24T07:01:32Z) - A systematic evaluation of methods for cell phenotype classification
using single-cell RNA sequencing data [7.62849213621469]
本研究は、細胞表現型を分類する13の一般的な教師付き機械学習アルゴリズムを評価する。
研究結果から、ElasticNetと対話は、中小のデータセットで最善を尽くしたことが示された。
論文 参考訳(メタデータ) (2021-10-01T23:24:15Z) - Combining Label Propagation and Simple Models Out-performs Graph Neural
Networks [52.121819834353865]
多くの標準的なトランスダクティブノード分類ベンチマークでは、最先端のGNNの性能を超えたり、一致させることができる。
これをC&S(Correct and Smooth)と呼ぶ。
我々のアプローチは、様々なベンチマークで最先端のGNNの性能を上回るか、ほぼ一致している。
論文 参考訳(メタデータ) (2020-10-27T02:10:52Z) - Split and Expand: An inference-time improvement for Weakly Supervised
Cell Instance Segmentation [71.50526869670716]
本研究では,分割マップのインスタンスへの変換を改善するために,2段階の後処理手順であるSplitとExpandを提案する。
Splitのステップでは,セルの集合をセグメント化マップから個々のセルインスタンスに分割し,セル中心の予測を導出する。
拡張ステップでは、細胞中心予測を用いて、小さな細胞が欠落していることが分かる。
論文 参考訳(メタデータ) (2020-07-21T14:05:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。