論文の概要: CellAgent: An LLM-driven Multi-Agent Framework for Automated Single-cell Data Analysis
- arxiv url: http://arxiv.org/abs/2407.09811v1
- Date: Sat, 13 Jul 2024 09:14:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 20:47:21.495901
- Title: CellAgent: An LLM-driven Multi-Agent Framework for Automated Single-cell Data Analysis
- Title(参考訳): CellAgent: 単一セルデータの自動解析のためのLLM駆動マルチエージェントフレームワーク
- Authors: Yihang Xiao, Jinyi Liu, Yan Zheng, Xiaohan Xie, Jianye Hao, Mingzhi Li, Ruitao Wang, Fei Ni, Yuxiao Li, Jintian Luo, Shaoqing Jiao, Jiajie Peng,
- Abstract要約: 単細胞RNAシークエンシング (scRNA-seq) データ解析は生物学的研究に不可欠である。
しかし、望ましい結果を得るために様々なツールを手動で操作することは、研究者にとって労働集約的である。
本稿では,ScRNA-seqデータ解析タスクの自動処理と実行のためのLLM駆動型マルチエージェントフレームワークであるCellAgentを紹介する。
- 参考スコア(独自算出の注目度): 35.61361183175167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) data analysis is crucial for biological research, as it enables the precise characterization of cellular heterogeneity. However, manual manipulation of various tools to achieve desired outcomes can be labor-intensive for researchers. To address this, we introduce CellAgent (http://cell.agent4science.cn/), an LLM-driven multi-agent framework, specifically designed for the automatic processing and execution of scRNA-seq data analysis tasks, providing high-quality results with no human intervention. Firstly, to adapt general LLMs to the biological field, CellAgent constructs LLM-driven biological expert roles - planner, executor, and evaluator - each with specific responsibilities. Then, CellAgent introduces a hierarchical decision-making mechanism to coordinate these biological experts, effectively driving the planning and step-by-step execution of complex data analysis tasks. Furthermore, we propose a self-iterative optimization mechanism, enabling CellAgent to autonomously evaluate and optimize solutions, thereby guaranteeing output quality. We evaluate CellAgent on a comprehensive benchmark dataset encompassing dozens of tissues and hundreds of distinct cell types. Evaluation results consistently show that CellAgent effectively identifies the most suitable tools and hyperparameters for single-cell analysis tasks, achieving optimal performance. This automated framework dramatically reduces the workload for science data analyses, bringing us into the "Agent for Science" era.
- Abstract(参考訳): 単細胞RNAシークエンシング (scRNA-seq) データ解析は、細胞多様性の精密な解析を可能にするため、生物学的研究に不可欠である。
しかし、望ましい結果を得るために様々なツールを手動で操作することは、研究者にとって労働集約的である。
この問題に対処するため,我々は,ScRNA-seqデータ解析タスクの自動処理と実行を目的として,LLM駆動のマルチエージェントフレームワークであるCellAgent(http://cell.agent4science.cn/)を紹介した。
まず、一般のLSMを生物学的分野に適用するために、CellAgentは、それぞれ特定の責任を持つプランナー、実行者、評価者といったLCM主導の生物学的専門家の役割を構築している。
次にCellAgentは、これらの生物学的専門家を協調させる階層的な意思決定メカニズムを導入し、複雑なデータ分析タスクの計画とステップバイステップの実行を効果的に推進する。
さらに,CellAgentが自律的に解を評価・最適化し,出力品質を保証できる自己定性最適化機構を提案する。
我々はCellAgentを、数十の組織と数百の異なる細胞タイプを含む包括的なベンチマークデータセットで評価した。
評価結果から,CellAgentは単一セル解析タスクに最適なツールやハイパーパラメータを効果的に識別し,最適な性能を実現していることが示された。
この自動化されたフレームワークは、科学データ分析の負荷を劇的に減らし、"Agent for Science"時代に入ります。
関連論文リスト
- Automating Exploratory Proteomics Research via Language Models [22.302672656499315]
PROTEUSは、生データから科学的発見を行うための完全に自動化されたシステムである。
人間の介入なしに研究目的、分析結果、新しい生物学的仮説を包括的に作成する。
論文 参考訳(メタデータ) (2024-11-06T08:16:56Z) - AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - GenoTEX: A Benchmark for Evaluating LLM-Based Exploration of Gene Expression Data in Alignment with Bioinformaticians [13.837406082703756]
我々は、遺伝子発現データの自動探索のためのベンチマークデータセットであるGenoTEXを紹介する。
GenoTEXは、幅広い遺伝子識別問題を解決するための注釈付きコードと結果を提供する。
我々は、文脈対応計画、反復的修正、ドメインエキスパートコンサルティングを設計したLLMベースのエージェントチームであるGenoAgentsを紹介する。
論文 参考訳(メタデータ) (2024-06-21T17:55:24Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization [86.61052121715689]
MatPlotAgentは、科学的データ可視化タスクを自動化するために設計された、モデルに依存しないフレームワークである。
MatPlotBenchは、100人の検証されたテストケースからなる高品質なベンチマークである。
論文 参考訳(メタデータ) (2024-02-18T04:28:28Z) - Large Language Model Agent for Hyper-Parameter Optimization [30.560250427498243]
多様な機械学習タスクにまたがるハイパーパラメータ最適化を自動化するために,LLM(Large Language Models)を活用した新しいパラダイムを導入する。
AgentHPOはタスク情報を自律的に処理し、特定のハイパーパラメータで実験を行い、反復的にそれらを最適化する。
このヒューマンライクな最適化プロセスは、必要な試行回数を大幅に削減し、セットアッププロセスを単純化し、解釈可能性とユーザ信頼を高める。
論文 参考訳(メタデータ) (2024-02-02T20:12:05Z) - Automated Bioinformatics Analysis via AutoBA [33.09743154722675]
Auto Bioinformatics Analysis(オートバイオインフォマティクス・アナリティクス・アナリティクス・アナリティクス、AutoBA)は、従来のオミクスデータ分析用に明示的に設計された大きな言語モデルに基づく自律型AIエージェントである。
AutoBAの堅牢性と適応性は、全ゲノムシークエンシング(WGS)、RNAシークエンシング(RNA-seq)、単細胞RNAシークエンシング(RNA-seq)、ChIP-seq、空間転写学など、様々なオミクス解析ケースで確認されている。
論文 参考訳(メタデータ) (2023-09-06T07:54:45Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。