論文の概要: CellForge: Agentic Design of Virtual Cell Models
- arxiv url: http://arxiv.org/abs/2508.02276v1
- Date: Mon, 04 Aug 2025 10:43:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.294824
- Title: CellForge: Agentic Design of Virtual Cell Models
- Title(参考訳): CellForge: 仮想セルモデルのエージェント設計
- Authors: Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, Yan Cui, Daniel Shao, Weixu Wang, Fang Wu, Yuchen Zhuang, Wenqi Shi, Zhi Huang, Arman Cohan, Xihong Lin, Fabian Theis, Smita Krishnaswamy, Mark Gerstein,
- Abstract要約: 本稿では,提示された生物データセットを仮想セルの最適化された計算モデルに変換するエージェントシステムであるCellForgeを紹介する。
このフレームワークは、タスク分析、メソッド設計、実験実行の3つのコアモジュールを統合している。
単一セル摂動予測におけるCellForgeの機能を示す。
- 参考スコア(独自算出の注目度): 24.938939602572702
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Virtual cell modeling represents an emerging frontier at the intersection of artificial intelligence and biology, aiming to predict quantities such as responses to diverse perturbations quantitatively. However, autonomously building computational models for virtual cells is challenging due to the complexity of biological systems, the heterogeneity of data modalities, and the need for domain-specific expertise across multiple disciplines. Here, we introduce CellForge, an agentic system that leverages a multi-agent framework that transforms presented biological datasets and research objectives directly into optimized computational models for virtual cells. More specifically, given only raw single-cell multi-omics data and task descriptions as input, CellForge outputs both an optimized model architecture and executable code for training virtual cell models and inference. The framework integrates three core modules: Task Analysis for presented dataset characterization and relevant literature retrieval, Method Design, where specialized agents collaboratively develop optimized modeling strategies, and Experiment Execution for automated generation of code. The agents in the Design module are separated into experts with differing perspectives and a central moderator, and have to collaboratively exchange solutions until they achieve a reasonable consensus. We demonstrate CellForge's capabilities in single-cell perturbation prediction, using six diverse datasets that encompass gene knockouts, drug treatments, and cytokine stimulations across multiple modalities. CellForge consistently outperforms task-specific state-of-the-art methods. Overall, CellForge demonstrates how iterative interaction between LLM agents with differing perspectives provides better solutions than directly addressing a modeling challenge. Our code is publicly available at https://github.com/gersteinlab/CellForge.
- Abstract(参考訳): 仮想セルモデリングは、人工知能と生物学の交差点における新たなフロンティアであり、多様な摂動に対する応答などの量を予測することを目的としている。
しかし、生物学的システムの複雑さ、データモダリティの不均一性、および複数の分野にわたるドメイン固有の専門知識の必要性により、仮想セルの自律的な計算モデルの構築は困難である。
本稿では、提示された生物データセットと研究目的を直接仮想セルの最適化された計算モデルに変換するマルチエージェントフレームワークを活用するエージェントシステムであるCellForgeを紹介する。
具体的には、生のシングルセルマルチオミクスデータとタスク記述のみを入力として指定すると、CellForgeは最適化されたモデルアーキテクチャと、仮想セルモデルと推論をトレーニングするための実行可能なコードの両方を出力する。
このフレームワークは3つのコアモジュールを統合している: 提示されたデータセットの特徴と関連する文献検索のためのタスク分析、最適化されたモデリング戦略を協調的に開発するメソッド設計、コードの自動生成のための実験実行。
デザインモジュールのエージェントは、異なる視点と中心的なモデレーターを持つ専門家に分割され、合理的な合意に達するまで、協力的にソリューションを交換する必要があります。
遺伝子ノックアウト、薬物治療、サイトカイン刺激を含む6つの多様なデータセットを用いて、単一細胞摂動予測におけるCellForgeの機能を示す。
CellForgeは、タスク固有の最先端メソッドを一貫して上回る。
全体として、CellForgeは、異なる視点を持つLLMエージェント間の反復的な相互作用が、モデリングの課題に直接対処するよりも優れたソリューションを提供する方法を示している。
私たちのコードはhttps://github.com/gersteinlab/CellForge.comで公開されています。
関連論文リスト
- CellVerse: Do Large Language Models Really Understand Cell Biology? [74.34984441715517]
我々は,4種類のシングルセルマルチオミクスデータを統合する統一言語中心の質問応答ベンチマークであるCellVerseを紹介する。
我々は,CellVerse上で160Mから671Bまでの14のオープンソースおよびクローズドソースLLMの性能を体系的に評価した。
論文 参考訳(メタデータ) (2025-05-09T06:47:23Z) - scReader: Prompting Large Language Models to Interpret scRNA-seq Data [12.767105992391555]
本稿では,大規模言語モデルの一般的な知識機能と,単一セルオミクスデータ解釈のためのドメイン固有表現モデルを統合する,革新的なハイブリッドアプローチを提案する。
単細胞遺伝子レベルでの遺伝子発現データをプロンプトで入力することにより、様々な種および細胞タイプにわたる遺伝子発現の差分レベルに基づいて、細胞表現を効果的にモデル化する。
論文 参考訳(メタデータ) (2024-12-24T04:28:42Z) - Progressive Vision-Language Prompt for Multi-Organ Multi-Class Cell Semantic Segmentation with Single Branch [23.307707756230513]
単一ブランクH(MONCH)を用いたマルチオルガNマルチクラスセルセマンティックセグメンテーション法
テキストと多粒度視覚特徴の相乗効果に着想を得て,マルチモーダル情報を調和させるプログレッシブプロンプトデコーダを導入する。
PanNukeデータセットの実験では、クラス不均衡と微妙な細胞サイズと形状の変化があり、MONCHは最先端の細胞分割法やビジョン言語モデルよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-12-04T02:44:38Z) - Omics-driven hybrid dynamic modeling of bioprocesses with uncertainty estimation [0.0]
この研究は、機械学習ツールを統合するオミクス駆動モデリングパイプラインを提示している。
ランダムフォレストと置換特徴の重要性は、オミクスデータセットをマイニングするために提案されている。
連続的かつ微分可能な機械学習関数は、減ったオミクス機能を動的モデルのキーコンポーネントにリンクするように訓練することができる。
論文 参考訳(メタデータ) (2024-10-24T15:50:35Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - CellAgent: An LLM-driven Multi-Agent Framework for Automated Single-cell Data Analysis [35.61361183175167]
単細胞RNAシークエンシング (scRNA-seq) データ解析は生物学的研究に不可欠である。
しかし、望ましい結果を得るために様々なツールを手動で操作することは、研究者にとって労働集約的である。
本稿では,ScRNA-seqデータ解析タスクの自動処理と実行のためのLLM駆動型マルチエージェントフレームワークであるCellAgentを紹介する。
論文 参考訳(メタデータ) (2024-07-13T09:14:50Z) - CAVACHON: a hierarchical variational autoencoder to integrate multi-modal single-cell data [10.429856767305687]
マルチモーダルデータ間の条件付き独立関係を明示的に組み込んだ新しい確率論的学習フレームワークを提案する。
単セルマルチオミクスデータ統合に関連する様々なアプリケーションにおけるフレームワークの汎用性を実証する。
論文 参考訳(メタデータ) (2024-05-28T23:44:09Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - An Empirical Study of Multimodal Model Merging [148.48412442848795]
モデルマージは、異なるタスクでトレーニングされた複数のモデルを融合してマルチタスクソリューションを生成するテクニックである。
我々は、モダリティ固有のアーキテクチャのビジョン、言語、およびクロスモーダルトランスフォーマーをマージできる新しい目標に向けて研究を行っている。
本稿では,重み間の距離を推定し,マージ結果の指標となる2つの指標を提案する。
論文 参考訳(メタデータ) (2023-04-28T15:43:21Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。