論文の概要: LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology
- arxiv url: http://arxiv.org/abs/2510.07793v1
- Date: Thu, 09 Oct 2025 05:12:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.876883
- Title: LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology
- Title(参考訳): LLM4Cell: シングルセル生物学のための大規模言語モデルとエージェントモデル
- Authors: Sajib Acharjee Dip, Adrika Zafor, Bikash Kumar Paul, Uddip Acharjee Shuvo, Muhit Islam Emon, Xuan Wang, Liqing Zhang,
- Abstract要約: 大規模言語モデル(LLM)と新しいエージェントフレームワークが単一細胞生物学を変革し始めている。
LLMは自然言語推論、生成アノテーション、マルチモーダルデータ統合を可能にする。
本研究は, 単細胞研究のために開発された58の基盤およびエージェントモデルの統一的な調査である。
- 参考スコア(独自算出の注目度): 10.007623929139545
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) and emerging agentic frameworks are beginning to transform single-cell biology by enabling natural-language reasoning, generative annotation, and multimodal data integration. However, progress remains fragmented across data modalities, architectures, and evaluation standards. LLM4Cell presents the first unified survey of 58 foundation and agentic models developed for single-cell research, spanning RNA, ATAC, multi-omic, and spatial modalities. We categorize these methods into five families-foundation, text-bridge, spatial, multimodal, epigenomic, and agentic-and map them to eight key analytical tasks including annotation, trajectory and perturbation modeling, and drug-response prediction. Drawing on over 40 public datasets, we analyze benchmark suitability, data diversity, and ethical or scalability constraints, and evaluate models across 10 domain dimensions covering biological grounding, multi-omics alignment, fairness, privacy, and explainability. By linking datasets, models, and evaluation domains, LLM4Cell provides the first integrated view of language-driven single-cell intelligence and outlines open challenges in interpretability, standardization, and trustworthy model development.
- Abstract(参考訳): 大規模言語モデル(LLM)と新興エージェントフレームワークは、自然言語推論、生成アノテーション、マルチモーダルデータ統合を有効にすることで、単一細胞生物学を変革し始めている。
しかし、進歩はデータモダリティ、アーキテクチャ、評価標準で断片化されている。
LLM4Cellは、RNA、ATAC、マルチオミック、空間的モダリティにまたがる単細胞研究のために開発された58の基盤とエージェントモデルの統一的な調査を初めて発表した。
本研究では,これらの手法を5つのファミリー境界,テキストブリッジ,空間,マルチモーダル,エピジェノミクス,エージェントに分類し,アノテーション,軌跡・摂動モデル,薬物応答予測を含む8つの重要な分析課題にマップする。
40以上の公開データセットに基づいて、ベンチマーク適合性、データの多様性、倫理的あるいはスケーラビリティの制約を分析し、生物学的接地、マルチオミクスアライメント、公正性、プライバシ、説明可能性を含む10のドメイン次元にわたるモデルを評価します。
LLM4Cellは、データセット、モデル、評価ドメインをリンクすることで、言語駆動の単一セルインテリジェンスに関する最初の統合ビューを提供し、解釈可能性、標準化、信頼できるモデル開発におけるオープンな課題を概説する。
関連論文リスト
- Large Language Models Meet Virtual Cell: A Survey [5.3507304878218145]
大型言語モデル(LLM)は「仮想細胞」の開発を可能にすることによって細胞生物学を変革している
この研究は、仮想セルモデリングのためのLLMの包括的なレビューを提供する。
論文 参考訳(メタデータ) (2025-10-09T02:41:30Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [221.34650992288505]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - Content Generation Models in Computational Pathology: A Comprehensive Survey on Methods, Applications, and Challenges [55.41538606569424]
レビューでは、画像生成、テキスト生成、分子プロファイル形態学生成などの4つの重要な領域に焦点を当てている。
我々は、コンテンツ生成アーキテクチャーの進化を、初期の生成的敵ネットワークから、拡散モデルや生成的視覚言語モデルにおける最近の進歩まで遡る。
レビューはオープン課題と今後の研究方向性について議論し、統合的かつ臨床的に展開可能な世代システムの開発に重点を置いて締めくくっている。
論文 参考訳(メタデータ) (2025-05-16T08:44:50Z) - CellVerse: Do Large Language Models Really Understand Cell Biology? [74.34984441715517]
我々は,4種類のシングルセルマルチオミクスデータを統合する統一言語中心の質問応答ベンチマークであるCellVerseを紹介する。
我々は,CellVerse上で160Mから671Bまでの14のオープンソースおよびクローズドソースLLMの性能を体系的に評価した。
論文 参考訳(メタデータ) (2025-05-09T06:47:23Z) - Multi-Modal Foundation Models for Computational Pathology: A Survey [32.25958653387204]
基礎モデルは、計算病理学(CPath)の強力なパラダイムとして登場した。
我々は、32の最先端マルチモーダル基盤モデルを、視覚言語、視覚知識グラフ、視覚生成表現の3つの主要なパラダイムに分類する。
病理学に適した28の利用可能なマルチモーダルデータセットを分析し、画像テキストペア、命令データセット、画像以外のモダリティペアにグループ化する。
論文 参考訳(メタデータ) (2025-03-12T06:03:33Z) - Large Language Models in Bioinformatics: A Survey [13.722344139230827]
大規模言語モデル(LLM)は生物情報学に革命をもたらし、DNA、RNA、タンパク質、単細胞データの高度な解析を可能にしている。
この調査は、ゲノム配列モデリング、RNA構造予測、タンパク質機能推論、単細胞転写学など、最近の進歩の体系的なレビューを提供する。
論文 参考訳(メタデータ) (2025-03-06T14:38:20Z) - Biomedical Foundation Model: A Survey [84.26268124754792]
ファンデーションモデルは、広範なラベルなしデータセットから学習する大規模な事前訓練モデルである。
これらのモデルは、質問応答や視覚的理解といった様々な応用に適応することができる。
本研究は,生物医学分野における基礎モデルの可能性を探るものである。
論文 参考訳(メタデータ) (2025-03-03T22:42:00Z) - Large Language Models for Bioinformatics [58.892165394487414]
本調査はバイオインフォマティクス特化言語モデル(BioLM)の進化,分類,特徴の識別に焦点をあてる。
疾患診断, 薬物発見, ワクチン開発などの重要な分野において, バイオフィルムの幅広い応用について検討する。
データプライバシやセキュリティ上の問題,解釈可能性の問題,トレーニングデータやモデル出力のバイアス,ドメイン適応複雑性など,BioLMに固有の重要な課題や制限を特定します。
論文 参考訳(メタデータ) (2025-01-10T01:43:05Z) - scReader: Prompting Large Language Models to Interpret scRNA-seq Data [12.767105992391555]
本稿では,大規模言語モデルの一般的な知識機能と,単一セルオミクスデータ解釈のためのドメイン固有表現モデルを統合する,革新的なハイブリッドアプローチを提案する。
単細胞遺伝子レベルでの遺伝子発現データをプロンプトで入力することにより、様々な種および細胞タイプにわたる遺伝子発現の差分レベルに基づいて、細胞表現を効果的にモデル化する。
論文 参考訳(メタデータ) (2024-12-24T04:28:42Z) - COMET: Benchmark for Comprehensive Biological Multi-omics Evaluation Tasks and Language Models [56.81513758682858]
COMETは、シングルオミクス、クロスオミクス、マルチオミクスタスクのモデルを評価することを目的としている。
まず、我々は、DNA、RNA、タンパク質の主要な構造的および機能的側面をカバーする、下流タスクとデータセットの多様なコレクションをキュレートし、開発する。
そこで我々は,DNA,RNA,タンパク質の既存の基礎言語モデルと,新たに提案されたマルチオミクス法を評価する。
論文 参考訳(メタデータ) (2024-12-13T18:42:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。