論文の概要: Towards Autonomous Mechanistic Reasoning in Virtual Cells
- arxiv url: http://arxiv.org/abs/2604.11661v2
- Date: Tue, 14 Apr 2026 04:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 14:01:13.523912
- Title: Towards Autonomous Mechanistic Reasoning in Virtual Cells
- Title(参考訳): 仮想細胞における自律的機械的推論に向けて
- Authors: Yunhui Jang, Lu Zhu, Jake Fawkes, Alisandra Kaye Denton, Dominique Beaini, Emmanuel Noutahi,
- Abstract要約: 本稿では,生物学的推論を機械的行動グラフとして表す仮想細胞に対する構造的説明形式について紹介する。
VCR-Agentは,生物の基盤となる知識検索と検証器に基づくフィルタリングを融合したマルチエージェントフレームワークである。
そこで本研究では,これらの説明を用いたトレーニングにより,実際の精度が向上し,下流遺伝子の発現予測のためのより効果的な監視信号が提供されることを示す。
- 参考スコア(独自算出の注目度): 11.11576245669328
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models (LLMs) have recently gained significant attention as a promising approach to accelerate scientific discovery. However, their application in open-ended scientific domains such as biology remains limited, primarily due to the lack of factually grounded and actionable explanations. To address this, we introduce a structured explanation formalism for virtual cells that represents biological reasoning as mechanistic action graphs, enabling systematic verification and falsification. Building upon this, we propose VCR-Agent, a multi-agent framework that integrates biologically grounded knowledge retrieval with a verifier-based filtering approach to generate and validate mechanistic reasoning autonomously. Using this framework, we release VC-TRACES dataset, which consists of verified mechanistic explanations derived from the Tahoe-100M atlas. Empirically, we demonstrate that training with these explanations improves factual precision and provides a more effective supervision signal for downstream gene expression prediction. These results underscore the importance of reliable mechanistic reasoning for virtual cells, achieved through the synergy of multi-agent and rigorous verification.
- Abstract(参考訳): 大規模言語モデル (LLM) は、科学的な発見を加速するための有望なアプローチとして近年注目されている。
しかしながら、生物学のようなオープンな科学分野への応用は、主に事実的根拠と行動可能な説明が欠如していることから、制限されている。
そこで本研究では,生物学的推論を機械的行動グラフとして表現し,体系的検証とファルシフィケーションを可能にする仮想セルの構造化説明形式について紹介する。
そこで本研究では,生物基盤の知識検索と検証器に基づくフィルタリング手法を統合し,機械的推論を自律的に生成・検証するマルチエージェントフレームワークであるVCR-Agentを提案する。
このフレームワークを用いて,Tahoe-100Mのアトラスから得られたメカニスティックな説明を検証したVC-TRACESデータセットをリリースする。
実験により,これらの説明を用いたトレーニングにより,実際の精度が向上し,下流遺伝子発現予測のためのより効果的な監視信号が提供されることを示した。
これらの結果は、マルチエージェントと厳密な検証の相乗効果によって達成された仮想細胞に対する信頼性機械的推論の重要性を浮き彫りにした。
関連論文リスト
- Discovering Mechanistic Models of Neural Activity: System Identification in an in Silico Zebrafish [0.8219355086755371]
幼魚ゼブラフィッシュのシミュレーションを基礎として, ニューラルネットワークの力学モデルをテストする。
LLMをベースとした木探索では,予測基準値を大幅に上回る予測モデルが自律的に発見された。
我々の洞察は、現実世界のニューラル記録をモデル化するためのガイダンスを提供し、AI駆動の科学的発見のためのより広範なテンプレートを提供する。
論文 参考訳(メタデータ) (2026-02-04T12:33:29Z) - Knowledge-Augmented Long-CoT Generation for Complex Biomolecular Reasoning [51.673503054645415]
生体分子機構は、分子間相互作用、シグナルカスケード、代謝経路の多段階的推論を必要とする。
既存のアプローチはしばしばこれらの問題を悪化させる: 推論ステップは生物学的事実から逸脱したり、長い機械的依存関係を捉えるのに失敗する。
本稿では,LLMと知識グラフに基づくマルチホップ推論チェーンを統合したLong-CoT推論フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-11T09:26:32Z) - No Foundations without Foundations -- Why semi-mechanistic models are essential for regulatory biology [5.925258390690544]
規制生物学の真の「基礎モデル」は、機械的洞察を原理化された実験設計と統合するフレームワークによってガイドされない限り、手の届かないままである、と我々は主張する。
本稿では、摂動に基づく実験設計を統一する基礎的な半機械的枠組みを提案する。
論文 参考訳(メタデータ) (2025-01-31T14:43:16Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Generative causal testing to bridge data-driven models and scientific theories in language neuroscience [82.995061475971]
脳における言語選択性の簡潔な説明を生成するためのフレームワークである生成因果テスト(GCT)を提案する。
GCTは機能的選択性に類似した脳領域の細粒度の違いを識別できることを示す。
論文 参考訳(メタデータ) (2024-10-01T15:57:48Z) - Unveiling Molecular Moieties through Hierarchical Grad-CAM Graph Explainability [0.0]
生物学的活性に対する分子サブストラクチャーの特定の寄与を解明するための説明可能な方法の統合は重要な課題である。
我々は,小分子のデータセットを用いて20個のGNNモデルを訓練し,キナーゼファミリーから20個のタンパク質標的上での活性を予測することを目標とした。
我々は階層型Grad-CAMグラフExplainerフレームワークを実装し,タンパク質-リガンド結合安定化を駆動する分子構造を詳細に解析する。
論文 参考訳(メタデータ) (2024-01-29T17:23:25Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - MEG: Generating Molecular Counterfactual Explanations for Deep Graph
Networks [11.291571222801027]
本稿では, 分子特性予測 t の文脈における深層グラフネットワークの説明可能性に取り組むための新しいアプローチを提案する。
我々は, 構造的類似度が高く, 予測特性の異なる(有意)化合物の形で, 特定の予測に対する情報的反実的説明を生成する。
モデルが非ML専門家に分子の近傍に焦点を絞った学習モデルに関する重要な洞察を伝達する方法を示す結果について議論する。
論文 参考訳(メタデータ) (2021-04-16T12:17:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。