論文の概要: SCALE:Scalable Conditional Atlas-Level Endpoint transport for virtual cell perturbation prediction
- arxiv url: http://arxiv.org/abs/2603.17380v1
- Date: Wed, 18 Mar 2026 05:51:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.527225
- Title: SCALE:Scalable Conditional Atlas-Level Endpoint transport for virtual cell perturbation prediction
- Title(参考訳): SCALE:仮想セル摂動予測のためのスケーラブルな条件付きアトラスレベルエンドポイントトランスポート
- Authors: Shuizhou Chen, Lang Yu, Kedu Jin, Songming Zhang, Hao Wu, Wenxuan Huang, Sheng Xu, Quan Qian, Qin Chen, Lei Bai, Siqi Sun, Zhangyang Gao,
- Abstract要約: 仮想セル摂動予測のための大規模基盤モデルを提案する。
まず、データスループットを大幅に改善するBioNeMoベースのトレーニングおよび推論フレームワークを構築します。
第二に、摂動予測を条件付き輸送として定式化し、それをセットアウェアフローアーキテクチャで実装する。
第3に,生物学的に有意な指標に基づく厳密なセルレベルプロトコルを用いて,Tahoe-100Mのモデルを評価する。
- 参考スコア(独自算出の注目度): 46.645872209565574
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Virtual cell models aim to enable in silico experimentation by predicting how cells respond to genetic, chemical, or cytokine perturbations from single-cell measurements. In practice, however, large-scale perturbation prediction remains constrained by three coupled bottlenecks: inefficient training and inference pipelines, unstable modeling in high-dimensional sparse expression space, and evaluation protocols that overemphasize reconstruction-like accuracy while underestimating biological fidelity. In this work we present a specialized large-scale foundation model SCALE for virtual cell perturbation prediction that addresses the above limitations jointly. First, we build a BioNeMo-based training and inference framework that substantially improves data throughput, distributed scalability, and deployment efficiency, yielding 12.51* speedup on pretrain and 1.29* on inference over the prior SOTA pipeline under matched system settings. Second, we formulate perturbation prediction as conditional transport and implement it with a set-aware flow architecture that couples LLaMA-based cellular encoding with endpoint-oriented supervision. This design yields more stable training and stronger recovery of perturbation effects. Third, we evaluate the model on Tahoe-100M using a rigorous cell-level protocol centered on biologically meaningful metrics rather than reconstruction alone. On this benchmark, our model improves PDCorr by 12.02% and DE Overlap by 10.66% over STATE. Together, these results suggest that advancing virtual cells requires not only better generative objectives, but also the co-design of scalable infrastructure, stable transport modeling, and biologically faithful evaluation.
- Abstract(参考訳): 仮想細胞モデルは、単一細胞の測定から細胞が遺伝、化学、サイトカインの摂動にどのように反応するかを予測することによって、シリコの実験を可能にすることを目的としている。
しかし、実際には、非効率なトレーニングと推論パイプライン、高次元スパース表現空間における不安定なモデリング、生物学的忠実さを過小評価しながら再構成のような精度を過大評価する評価プロトコルの3つの複合ボトルネックによって、大規模な摂動予測が制限されている。
本研究では,上記の制約に対処する仮想セル摂動予測のための,大規模基盤モデルSCALEを提案する。
まず、データスループット、分散スケーラビリティ、デプロイメント効率を大幅に改善するBioNeMoベースのトレーニングおよび推論フレームワークを構築し、事前トレーニングで12.51*、マッチしたシステム設定で以前のSOTAパイプライン上での推論で1.29*のスピードアップを実現した。
第二に、摂動予測を条件輸送として定式化し、LLaMAベースのセルエンコーディングとエンドポイント指向の監視を結合したセットアウェアフローアーキテクチャで実装する。
この設計はより安定した訓練と摂動効果のより強い回復をもたらす。
第3に,再建のみではなく,生物学的に有意な指標に着目した厳密なセルレベルプロトコルを用いて,Tahoe-100Mのモデルの評価を行った。
このベンチマークでは、PDCorrを12.02%改善し、De Overlapを10.66%上回った。
これらの結果は、仮想細胞を前進させるには、より良い生成目的だけでなく、スケーラブルなインフラの共設計、安定した輸送モデル、生物学的に忠実な評価が必要であることを示唆している。
関連論文リスト
- Adaptive Uncertainty-Guided Surrogates for Efficient phase field Modeling of Dendritic Solidification [0.24629531282150874]
本研究は, 微小XGおよびCNNを用いた不確実性駆動型適応サンプリングを用いた樹状固化反応の代理モデルを提案する。
このフレームワークは、時間選択、適応サンプリング、およびドメインインフォームドデータ駆動サロゲートの選択がX時間モデルの性能にどのように影響するかを体系的に調査する。
論文 参考訳(メタデータ) (2026-02-17T10:43:24Z) - From Evaluation to Design: Using Potential Energy Surface Smoothness Metrics to Guide Machine Learning Interatomic Potential Architectures [12.68400434984463]
MLIPは量子ポテンシャルエネルギー表面の物理的滑らかさを再現することができない。
マイクロカノニカル分子動力学のような既存の評価は計算に高価であり、主に近平衡状態を研究する。
MLIPの評価基準を改善するためにBSCT(Band Smoothness Characterization Test)を導入する。
論文 参考訳(メタデータ) (2026-02-04T18:50:10Z) - Universal Battery Degradation Forecasting Driven by Foundation Model Across Diverse Chemistries and Conditions [15.502149500162227]
この研究は、様々な化学薬品や使用シナリオにわたる堅牢なパフォーマンスを維持する、統一されたキャパシティ予測フレームワークを提案する。
我々は20の公開老化データセットを1,704個の細胞と3,961,195個の充電サイクルセグメントを含む大規模コーパスにキュレートした。
観測されたデータセットと、意図的に保持されていないデータセットの両方の実験は、単一の統一モデルが、強いデータセット毎のベースラインと比較して、競争力または優れた精度を達成することを示している。
論文 参考訳(メタデータ) (2025-12-30T10:14:37Z) - Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Linearized Optimal Transport for Analysis of High-Dimensional Point-Cloud and Single-Cell Data [45.87606039212519]
シングルセル技術は、細胞の高次元点雲を生成する。
各患者は単純なベクトルではなく不規則な点雲で表される。
線形最適輸送フレームワークを用いて不規則点雲を固定次元ユークリッド空間に埋め込む。
論文 参考訳(メタデータ) (2025-10-24T21:33:12Z) - TGLF-SINN: Deep Learning Surrogate Model for Accelerating Turbulent Transport Modeling in Fusion [18.028061388104963]
我々は,3つの重要なイノベーションを持つtextbfTGLF-SINN (Spectra-Informed Neural Network) を提案する。
我々の手法は、トレーニングデータを大幅に減らし、優れたパフォーマンスを実現する。
下流フラックスマッチングアプリケーションでは、NNサロゲートがTGLFの45倍のスピードアップを提供しながら、同等の精度を維持しています。
論文 参考訳(メタデータ) (2025-09-07T09:36:51Z) - STONet: A neural operator for modeling solute transport in micro-cracked reservoirs [0.49998148477760973]
マイクロクラック多孔質媒体の汚染物質輸送を効率的にモデル化する新しいニューラル演算子であるソルトトランスポート・オペレーターネットワーク(STONet)を導入する。
数値実験により,STONetの精度はFEMシミュレーションと比較して1%以下であることがわかった。
論文 参考訳(メタデータ) (2024-12-07T07:53:47Z) - CRTRE: Causal Rule Generation with Target Trial Emulation Framework [47.2836994469923]
ターゲットトライアルエミュレーションフレームワーク(CRTRE)を用いた因果ルール生成という新しい手法を提案する。
CRTREは、アソシエーションルールの因果効果を推定するためにランダム化トライアル設計原則を適用している。
次に、病気発症予測などの下流アプリケーションにそのような関連ルールを組み込む。
論文 参考訳(メタデータ) (2024-11-10T02:40:06Z) - Learning Large-scale Subsurface Simulations with a Hybrid Graph Network
Simulator [57.57321628587564]
本研究では3次元地下流体の貯留層シミュレーションを学習するためのハイブリッドグラフネットワークシミュレータ (HGNS) を提案する。
HGNSは、流体の進化をモデル化する地下グラフニューラルネットワーク(SGNN)と、圧力の進化をモデル化する3D-U-Netで構成されている。
産業標準地下フローデータセット(SPE-10)と1100万セルを用いて,HGNSが標準地下シミュレータの18倍の推算時間を短縮できることを実証した。
論文 参考訳(メタデータ) (2022-06-15T17:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。