論文の概要: UBio-MolFM: A Universal Molecular Foundation Model for Bio-Systems
- arxiv url: http://arxiv.org/abs/2602.17709v1
- Date: Fri, 13 Feb 2026 04:38:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.073436
- Title: UBio-MolFM: A Universal Molecular Foundation Model for Bio-Systems
- Title(参考訳): UBio-MolFM: バイオシステムのための普遍的分子基盤モデル
- Authors: Lin Huang, Arthur Jiang, XiaoLi Liu, Zion Wang, Jason Zhao, Chu Wang, HaoCheng Lu, ChengXiang Huang, JiaJun Cheng, YiYue Du, Jia Zhang,
- Abstract要約: 本稿では,量子力学(QM)の精度と生物学的スケールのギャップを埋めるために設計された,普遍的な基礎モデルフレームワークUBio-MolFMを提案する。
UBio-MolFMは、大きな分布外生物分子系(最大1500原子)と現実的な可観測物において、アブイニシオレベルの忠実性を達成する。
- 参考スコア(独自算出の注目度): 12.633470669776317
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: All-atom molecular simulation serves as a quintessential ``computational microscope'' for understanding the machinery of life, yet it remains fundamentally limited by the trade-off between quantum-mechanical (QM) accuracy and biological scale. We present UBio-MolFM, a universal foundation model framework specifically engineered to bridge this gap. UBio-MolFM introduces three synergistic innovations: (1) UBio-Mol26, a large bio-specific dataset constructed via a multi-fidelity ``Two-Pronged Strategy'' that combines systematic bottom-up enumeration with top-down sampling of native protein environments (up to 1,200 atoms); (2) E2Former-V2, a linear-scaling equivariant transformer that integrates Equivariant Axis-Aligned Sparsification (EAAS) and Long-Short Range (LSR) modeling to capture non-local physics with up to ~4x higher inference throughput in our large-system benchmarks; and (3) a Three-Stage Curriculum Learning protocol that transitions from energy initialization to energy-force consistency, with force-focused supervision to mitigate energy offsets. Rigorous benchmarking across microscopic forces and macroscopic observables -- including liquid water structure, ionic solvation, and peptide folding -- demonstrates that UBio-MolFM achieves ab initio-level fidelity on large, out-of-distribution biomolecular systems (up to ~1,500 atoms) and realistic MD observables. By reconciling scalability with quantum precision, UBio-MolFM provides a robust, ready-to-use tool for the next generation of computational biology.
- Abstract(参考訳): 全原子分子シミュレーションは、生命の機械を理解するための「計算顕微鏡」として機能するが、量子力学(QM)の精度と生物学的スケールのトレードオフにより、基本的に制限されている。
我々はこのギャップを埋めるために特別に設計された普遍的な基盤モデルフレームワークUBio-MolFMを紹介する。
UBio-MolFMは、1つのシナジスティックなイノベーションを紹介している: (1) UBio-Mol26は、多要素 ' ‘Two-Pronged Strategy'' で構築された大規模なバイオ固有データセットで、組織的なボトムアップ列挙とネイティブタンパク質環境(最大1,200個の原子)のトップダウンサンプリングを組み合わせる。
液体水構造、イオン溶出、ペプチドの折りたたみなど、微視的な力とマクロな可観測物にわたる厳密なベンチマークは、UBio-MolFMが、大きな分布外生体分子系(最大1,500原子)と現実的なMD可観測物において、アブイニトロレベルの忠実性を達成していることを示している。
量子精度でスケーラビリティを調整することにより、UBio-MolFMは次世代の計算生物学のための堅牢で使いやすいツールを提供する。
関連論文リスト
- Zatom-1: A Multimodal Flow Foundation Model for 3D Molecules and Materials [51.342983349686556]
汎用的な3Dケミカルモデリングは分子や材料を含み、生成能力と予測能力の両方を必要とする。
Zatom-1は、3D分子や材料の生成的および予測的学習を統一する、エンド・ツー・エンドの完全なオープンソース基盤モデルである。
論文 参考訳(メタデータ) (2026-02-24T20:52:39Z) - Learning Cell-Aware Hierarchical Multi-Modal Representations for Robust Molecular Modeling [74.25438319700929]
分子と細胞応答の局所的グローバル依存性をモデル化する堅牢なフレームワークであるCHMR(Cell-aware Hierarchical Multi-modal Representations)を提案する。
728タスクにまたがる9つの公開ベンチマークで評価され、CHMRは最先端のベースラインを上回っている。
その結果, 階層認識型マルチモーダル学習による分子表現の信頼性, 生物学的基盤化の利点が示された。
論文 参考訳(メタデータ) (2025-11-26T07:15:00Z) - HemePLM-Diffuse: A Scalable Generative Framework for Protein-Ligand Dynamics in Large Biomolecular System [0.0]
本稿では,タンパク質リガンド軌道の正確なシミュレーションを目的とした,革新的な生成変換モデルであるHemeM-Diffuseを紹介する。
本稿では,3CQV HEMEシステムを用いて,TorchMD-Net,MDGEN,Uni-Molなどの先行モデルと比較して,精度とスケーラビリティを向上した性能を示す。
論文 参考訳(メタデータ) (2025-08-07T17:29:52Z) - A Scalable and Quantum-Accurate Foundation Model for Biomolecular Force Field via Linearly Tensorized Quadrangle Attention [6.749581549330875]
我々は、原子性生体分子シミュレーションのための新しいAIベースの力場フレームワークLiTENを紹介する。
LiTENをベースとしたLiTEN-FFは、幅広い化学一般化のためのnablaDFTデータセットで事前訓練された堅牢なAIFF基盤モデルである。
LiTENは、rMD17、MD22、Chignolinのほとんどの評価サブセットでSOTA(State-of-the-art)のパフォーマンスを達成し、MACE、NequIP、EquiFormerといった主要なモデルよりも優れている。
論文 参考訳(メタデータ) (2025-07-01T15:52:39Z) - Bio2Token: All-atom tokenization of any biomolecular structure with Mamba [3.039173168183899]
完全タンパク質,RNAおよび小分子構造の原子レベルのトークン化を学習する量子化オートエンコーダを開発した。
単純なマンバ状態空間モデルアーキテクチャはSE(3)不変のIPAアーキテクチャと比較して効率的であることを示す。
バイオ2トケンの学習された構造トークンは、将来全ての原子生成モデルの入力として機能する可能性がある。
論文 参考訳(メタデータ) (2024-10-24T19:23:09Z) - CryoFM: A Flow-based Foundation Model for Cryo-EM Densities [50.291974465864364]
生成モデルとして設計された基礎モデルであるCryoFMについて,高品質密度マップの分布を学習する。
フローマッチングに基づいて構築されたCryoFMは、生物分子密度マップの以前の分布を正確に捉えるために訓練されている。
論文 参考訳(メタデータ) (2024-10-11T08:53:58Z) - Machine-learned molecular mechanics force field for the simulation of
protein-ligand systems and beyond [33.54862439531144]
生体分子シミュレーションとコンピュータ支援薬物設計には, 信頼性および分子力学(MM)力場の開発が不可欠である。
本稿では、一般化された機械学習型MM力場、ttexttespaloma-0.3、およびグラフニューラルネットワークを用いたエンドツーエンドの微分可能なフレームワークを紹介する。
力場は、小さな分子、ペプチド、核酸を含む薬物発見に非常に関係した化学ドメインの量子化学エネルギー特性を再現する。
論文 参考訳(メタデータ) (2023-07-13T23:00:22Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - Basis-independent system-environment coherence is necessary to detect
magnetic field direction in an avian-inspired quantum magnetic sensor [77.34726150561087]
我々は、衝突環境の影響下で、第3の「スキャベンジャー」ラジカルを持つ2つのラジカルからなる鳥由来の量子磁気センサを考察する。
最適性能には,初期システム環境状態が非最大混合である基底非依存コヒーレンスが必要であることを示す。
論文 参考訳(メタデータ) (2020-11-30T17:19:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。