論文の概要: AROMA: Augmented Reasoning Over a Multimodal Architecture for Virtual Cell Genetic Perturbation Modeling
- arxiv url: http://arxiv.org/abs/2604.20263v1
- Date: Wed, 22 Apr 2026 07:10:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.007896
- Title: AROMA: Augmented Reasoning Over a Multimodal Architecture for Virtual Cell Genetic Perturbation Modeling
- Title(参考訳): AROMA: 仮想細胞遺伝的摂動モデリングのためのマルチモーダルアーキテクチャ
- Authors: Zhenyu Wang, Geyan Ye, Wei Liu, Man Tat Alexander Ng,
- Abstract要約: 本稿では,仮想細胞遺伝的摂動モデリングのためのマルチモーダルアーキテクチャ上でのAugmented Reasoningを提案する。
AROMAは、テキストエビデンス、グラフトポロジー情報、タンパク質配列機能を統合し、摂動ターゲット依存性をモデル化する。
正確かつ解釈可能な予測を得るために、2段階最適化戦略で訓練されている。
- 参考スコア(独自算出の注目度): 10.19071074895934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual cell modeling predicts molecular state changes under genetic perturbations in silico, which is essential for biological mechanism studies. However, existing approaches suffer from unconstrained reasoning, uninterpretable predictions, and retrieval signals that are weakly aligned with regulatory topology. To address these limitations, we propose AROMA, an Augmented Reasoning Over a Multimodal Architecture for virtual cell genetic perturbation modeling. AROMA integrates textual evidence, graph-topology information, and protein sequence features to model perturbation-target dependencies, and is trained with a two-stage optimization strategy to yield predictions that are both accurate and interpretable. We also construct two knowledge graphs and a perturbation reasoning dataset, PerturbReason, containing more than 498k samples, as reusable resources for the virtual cell domain. Experiments show that AROMA outperforms existing methods across multiple cell lines, and remains robust under zero-shot evaluation on an unseen cell line, as well as in knowledge-sparse, long-tail scenarios. Overall, AROMA demonstrates that combining knowledge-driven multimodal modeling with evidence retrieval provides a promising pathway toward more reliable and interpretable virtual cell perturbation prediction. Model weights are available at https://huggingface.co/blazerye/AROMA. Code is available at https://github.com/blazerye/AROMA.
- Abstract(参考訳): 仮想細胞モデリングは、サイリコの遺伝的摂動の下で分子状態の変化を予測する。
しかし、既存のアプローチは規制トポロジに弱い制約のない推論、解釈不能な予測、検索信号に悩まされている。
これらの制約に対処するため,仮想細胞遺伝的摂動モデリングのためのAROMA(Augmented Reasoning Over a Multimodal Architecture)を提案する。
AROMAは、テキストエビデンス、グラフトポロジー情報、タンパク質配列の特徴を統合して摂動とターゲットの依存関係をモデル化し、正確かつ解釈可能な予測を生成するための2段階最適化戦略で訓練されている。
また、仮想セル領域の再利用資源として、498k以上のサンプルを含む2つの知識グラフと摂動推論データセットPerturbReasonを構築した。
実験の結果、AROMAは複数の細胞株にまたがる既存の手法よりも優れており、未知の細胞株のゼロショット評価や知識に乏しい長い尾のシナリオでは頑健であることがわかった。
AROMAは、知識駆動型マルチモーダルモデリングとエビデンス検索を組み合わせることで、より信頼性が高く解釈可能な仮想セル摂動予測への有望な経路を提供することを示した。
モデルウェイトはhttps://huggingface.co/blazerye/AROMA.comで入手できる。
コードはhttps://github.com/blazerye/AROMA.comで入手できる。
関連論文リスト
- MAT-Cell: A Multi-Agent Tree-Structured Reasoning Framework for Batch-Level Single-Cell Annotation [81.82645086402366]
MAT-Cellは,単細胞解析を構築的で検証可能な証明生成に再構成する,ニューロシンボリック推論フレームワークである。
MAT-Cellは、適応型レトリーバル増強生成(RAG)を通じて、生物学的公理の基底神経推論に象徴的な制約を注入し、転写ノイズを減少させる。
最先端のSOTA(State-of-the-art)モデルを大幅に上回り、挑戦的なシナリオにおいて堅牢なパフォーマンスを維持します。
論文 参考訳(メタデータ) (2026-04-07T04:56:06Z) - Lingshu-Cell: A generative cellular world model for transcriptome modeling toward virtual cells [48.885716676667776]
Lingshu-Cellは、転写状態の分布を学習し、摂動下で条件シミュレーションをサポートする離散拡散モデルである。
約18,000の遺伝子にまたがる複雑なトランスクリプトーム全体の発現依存性を、以前の遺伝子選択に頼らずに捕捉する。
これは、Virtual Cell Challenge H1遺伝子摂動ベンチマークにおいて、ヒトPBMCのサイトカイン誘発反応の予測において、主要な性能を発揮する。
論文 参考訳(メタデータ) (2026-03-26T09:46:27Z) - Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation [11.439588896862155]
PT-RAG(Perturbation-aware Two-stage Retrieval-Augmented Generation)は、レトリーバル-Augmented Generationを従来の言語モデルから細胞生物学まで拡張する新しいフレームワークである。
本研究は,遺伝子摂動に対する細胞応答をモデル化するための将来的なパラダイムとして,検索増強世代を確立した。
論文 参考訳(メタデータ) (2026-03-07T14:31:27Z) - Learning Cell-Aware Hierarchical Multi-Modal Representations for Robust Molecular Modeling [74.25438319700929]
分子と細胞応答の局所的グローバル依存性をモデル化する堅牢なフレームワークであるCHMR(Cell-aware Hierarchical Multi-modal Representations)を提案する。
728タスクにまたがる9つの公開ベンチマークで評価され、CHMRは最先端のベースラインを上回っている。
その結果, 階層認識型マルチモーダル学習による分子表現の信頼性, 生物学的基盤化の利点が示された。
論文 参考訳(メタデータ) (2025-11-26T07:15:00Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - TopoCellGen: Generating Histopathology Cell Topology with a Diffusion Model [32.670806339139034]
本研究では,トポロジ制約を拡散モデルに統合し,現実的で文脈的に正確なセルトポロジの生成を改善する手法を提案する。
本手法は, セル分布と相互作用のシミュレーションを改良し, 下流タスクにおける結果の精度と解釈可能性を高める。
論文 参考訳(メタデータ) (2024-12-08T18:02:22Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。