論文の概要: CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis
- arxiv url: http://arxiv.org/abs/2602.13346v1
- Date: Thu, 12 Feb 2026 20:20:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:27.932255
- Title: CellMaster: Collaborative Cell Type Annotation in Single-Cell Analysis
- Title(参考訳): CellMaster:シングルセル解析における協調型細胞型アノテーション
- Authors: Zhen Wang, Yiming Gao, Jieyuan Liu, Enze Ma, Jefferson Chen, Mark Antkowiak, Mengzhou Hu, JungHo Kong, Dexter Pratt, Zhiting Hu, Wei Wang, Trey Ideker, Eric P. Xing,
- Abstract要約: ゼロショット型アノテーションのエキスパートプラクティスを模倣したAIエージェントであるCellMasterを提案する。
8つの組織にまたがる9つのデータセットで、CellMasterはオートマチックモードで最高のパフォーマンスのベースラインよりも精度を7.1%向上した。
このシステムは、基準線がしばしば失敗する稀で新しい細胞状態において、特定の強度を示す。
- 参考スコア(独自算出の注目度): 35.57672494910454
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-cell RNA-seq (scRNA-seq) enables atlas-scale profiling of complex tissues, revealing rare lineages and transient states. Yet, assigning biologically valid cell identities remains a bottleneck because markers are tissue- and state-dependent, and novel states lack references. We present CellMaster, an AI agent that mimics expert practice for zero-shot cell-type annotation. Unlike existing automated tools, CellMaster leverages LLM-encoded knowledge (e.g., GPT-4o) to perform on-the-fly annotation with interpretable rationales, without pre-training or fixed marker databases. Across 9 datasets spanning 8 tissues, CellMaster improved accuracy by 7.1% over best-performing baselines (including CellTypist and scTab) in automatic mode. With human-in-the-loop refinement, this advantage increased to 18.6%, with a 22.1% gain on subtype populations. The system demonstrates particular strength in rare and novel cell states where baselines often fail. Source code and the web application are available at \href{https://github.com/AnonymousGym/CellMaster}{https://github.com/AnonymousGym/CellMaster}.
- Abstract(参考訳): 単細胞RNA-seq(scRNA-seq)は、複雑な組織のアトラススケールのプロファイリングを可能にし、希少な系統と過渡的な状態を明らかにする。
しかし、マーカーは組織と状態に依存しており、新しい状態は参照を欠いているため、生物学的に有効な細胞アイデンティティーの割り当てはボトルネックのままである。
ゼロショット型アノテーションのエキスパートプラクティスを模倣したAIエージェントであるCellMasterを提案する。
既存の自動化ツールとは異なり、CellMasterはLPMエンコードされた知識(例えばGPT-4o)を活用して、事前トレーニングや固定されたマーカーデータベースを使わずに、解釈可能な合理性を持ったオンザフライアノテーションを実行する。
8つの組織にまたがる9つのデータセットで、CellMasterは自動モードで最高のパフォーマンスのベースライン(CellTypistやscTabを含む)よりも精度を7.1%向上した。
ヒト・イン・ザ・ループの改良により、この利点は18.6%まで増加し、亜型人口は22.1%増加した。
このシステムは、基準線がしばしば失敗する稀で新しい細胞状態において、特定の強度を示す。
ソースコードとWebアプリケーションは、 \href{https://github.com/AnonymousGym/CellMaster}{https://github.com/AnonymousGym/CellMaster}で入手できる。
関連論文リスト
- GRIT: Graph-Regularized Logit Refinement for Zero-shot Cell Type Annotation [15.465706196179676]
細胞型アノテーションは単細胞RNAシークエンシング(scRNA-seq)データの解析における基本的なステップである。
CLIPスタイルモデルの最近の進歩は、細胞型アノテーションの自動化への有望な道を提供する。
本稿では,グラフ正規化最適化フレームワークを用いて,LangCellが生成するゼロショットロジットを改良することを提案する。
論文 参考訳(メタデータ) (2025-08-06T07:09:46Z) - Cell-o1: Training LLMs to Solve Single-Cell Reasoning Puzzles with Reinforcement Learning [44.91329557101423]
我々はCellPuzzlesタスクを導入し、その目的はセルのバッチにユニークなセルタイプを割り当てることである。
このベンチマークは、様々な組織、疾患、ドナーの状態にまたがっており、ラベルの独特性を保証するために、バッチレベルの細胞コンテキストをまたいで推論する必要がある。
蒸留液の微調整を施した7B LLMのCell-o1を提案する。
論文 参考訳(メタデータ) (2025-06-03T14:16:53Z) - CellVerse: Do Large Language Models Really Understand Cell Biology? [74.34984441715517]
我々は,4種類のシングルセルマルチオミクスデータを統合する統一言語中心の質問応答ベンチマークであるCellVerseを紹介する。
我々は,CellVerse上で160Mから671Bまでの14のオープンソースおよびクローズドソースLLMの性能を体系的に評価した。
論文 参考訳(メタデータ) (2025-05-09T06:47:23Z) - Real-Time Cell Sorting with Scalable In Situ FPGA-Accelerated Deep Learning [2.0717688648414065]
我々は,光電場顕微鏡画像を用いたラベルなしの細胞分類のための機械学習フレームワークを提案する。
本フレームワークは,T4,T8,Bのセルタイプを,80,000の事前処理画像のデータセットで正確に分類する。
FPGAを高速化した学生モデルは、14.5$mu$sの超低レイテンシと24.7$mu$sの完全なセル検出ソートトリガ時間を実現する。
論文 参考訳(メタデータ) (2025-03-16T19:32:11Z) - CellViT++: Energy-Efficient and Adaptive Cell Segmentation and Classification Using Foundation Models [1.7674154313605157]
$textCellViTscriptstyle ++$は、デジタル病理学における一般化された細胞セグメンテーションのためのフレームワークである。
$textCellViTscriptstyle ++$は、ユーザフレンドリで、ビジュアライゼーションとアノテーションのためのWebベースのインターフェースを備えたオープンソースのフレームワークである。
論文 参考訳(メタデータ) (2025-01-09T14:26:50Z) - Single-Cell Omics Arena: A Benchmark Study for Large Language Models on Cell Type Annotation Using Single-Cell Data [13.56585855722118]
大規模言語モデル(LLM)は、テキストの膨大なコーパスを効率的に処理し、合成し、生物学的知識を自動的に抽出する能力を実証している。
本研究は、単一細胞RNAシークエンシング(scRNA-seq)データにおいて、細胞型を正確に分類し、アノテートするLLMの可能性を探るものである。
以上の結果から,LCMは微調整を必要とせずに単一セルデータの堅牢な解釈を実現できることが示された。
論文 参考訳(メタデータ) (2024-12-03T23:58:35Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - RigLSTM: Recurrent Independent Grid LSTM for Generalizable Sequence
Learning [75.61681328968714]
本稿では,対象タスクの基盤となるモジュール構造を利用するために,リカレントな独立したGrid LSTM(RigLSTM)を提案する。
本モデルでは, セル選択, 入力特徴選択, 隠れ状態選択, ソフト状態更新を採用し, より優れた一般化を実現する。
論文 参考訳(メタデータ) (2023-11-03T07:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。