論文の概要: GenoMAS: A Multi-Agent Framework for Scientific Discovery via Code-Driven Gene Expression Analysis
- arxiv url: http://arxiv.org/abs/2507.21035v2
- Date: Thu, 31 Jul 2025 17:57:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 13:02:07.690355
- Title: GenoMAS: A Multi-Agent Framework for Scientific Discovery via Code-Driven Gene Expression Analysis
- Title(参考訳): GenoMAS:コード駆動遺伝子発現解析による科学的発見のためのマルチエージェントフレームワーク
- Authors: Haoyang Liu, Yijiang Li, Haohan Wang,
- Abstract要約: GenoMASは、タイプされたメッセージパッシングプロトコルを通じて6つの特殊エージェントを編成する。
GenoMASの中心には、ガイド付き計画フレームワークがある。
GenoMASは生物学的に証明可能な遺伝子フェノタイプ関連をその文献で裏付ける。
- 参考スコア(独自算出の注目度): 12.311957227670598
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gene expression analysis holds the key to many biomedical discoveries, yet extracting insights from raw transcriptomic data remains formidable due to the complexity of multiple large, semi-structured files and the need for extensive domain expertise. Current automation approaches are often limited by either inflexible workflows that break down in edge cases or by fully autonomous agents that lack the necessary precision for rigorous scientific inquiry. GenoMAS charts a different course by presenting a team of LLM-based scientists that integrates the reliability of structured workflows with the adaptability of autonomous agents. GenoMAS orchestrates six specialized LLM agents through typed message-passing protocols, each contributing complementary strengths to a shared analytic canvas. At the heart of GenoMAS lies a guided-planning framework: programming agents unfold high-level task guidelines into Action Units and, at each juncture, elect to advance, revise, bypass, or backtrack, thereby maintaining logical coherence while bending gracefully to the idiosyncrasies of genomic data. On the GenoTEX benchmark, GenoMAS reaches a Composite Similarity Correlation of 89.13% for data preprocessing and an F$_1$ of 60.48% for gene identification, surpassing the best prior art by 10.61% and 16.85% respectively. Beyond metrics, GenoMAS surfaces biologically plausible gene-phenotype associations corroborated by the literature, all while adjusting for latent confounders. Code is available at https://github.com/Liu-Hy/GenoMAS.
- Abstract(参考訳): 遺伝子発現解析は多くの生物医学的な発見の鍵を握るが、複数の大きな半構造化ファイルの複雑さと広範なドメインの専門知識の必要性により、生の転写学的データから洞察を抽出することは依然として困難である。
現在の自動化アプローチは、エッジケースでブレークダウンする柔軟性のないワークフローや、厳格な科学的調査に必要な正確性に欠ける完全自律エージェントによって制限されることが多い。
GenoMASは、構造化ワークフローの信頼性と自律エージェントの適応性を統合するLLMベースの科学者のチームを示すことで、異なるコースをグラフ化している。
GenoMASは、タイプされたメッセージパスプロトコルを通じて6つの特殊なLDMエージェントをオーケストレーションし、それぞれが共有分析キャンバスに補完的な強度を提供する。
GenoMASの中心には、ガイド付き計画フレームワークがある。プログラムエージェントは、ハイレベルなタスクガイドラインをアクションユニットに展開し、各分岐において、前進、修正、バイパス、バックトラックを選択し、ゲノムデータの慣用性に優雅に屈りながら論理的一貫性を維持する。
GenoTEXベンチマークで、GenoMASはデータ前処理で89.13%、遺伝子識別でF$_1$の60.48%に達し、それぞれ10.61%と16.85%という最高の先行技術を上回っている。
メトリクス以外にも、GenoMASは生物学的に証明可能な遺伝子フェノタイプ関連が文献によって裏付けられ、潜伏した共同設立者向けに調整されている。
コードはhttps://github.com/Liu-Hy/GenoMASで入手できる。
関連論文リスト
- GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - GenoTEX: An LLM Agent Benchmark for Automated Gene Expression Data Analysis [19.78030916589553]
本稿では、遺伝子発現データの自動解析のためのベンチマークデータセットであるGenoTEXを紹介する。
GenoTEXは、幅広い遺伝子取引関連問題を解決するための解析コードと結果を提供する。
フレキシブルな自己補正を備えた多段階プログラミングワークフローを採用したLLMエージェントチームであるGenoAgentを紹介する。
論文 参考訳(メタデータ) (2024-06-21T17:55:24Z) - GeneAgent: Self-verification Language Agent for Gene Set Knowledge Discovery using Domain Databases [5.831842925038342]
自己検証機能を備えた第一種言語エージェントGeneAgentを提案する。
様々な生物学的データベースと自律的に相互作用し、精度を高め、幻覚の発生を減らす。
異なるソースから1,106の遺伝子セットをベンチマークすると、GeneAgentは標準のGPT-4よりずっと優れています。
論文 参考訳(メタデータ) (2024-05-25T12:35:15Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures [0.0]
がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
論文 参考訳(メタデータ) (2023-05-01T07:16:40Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。