論文の概要: Simultaneous Modeling of Protein Conformation and Dynamics via Autoregression
- arxiv url: http://arxiv.org/abs/2505.17478v1
- Date: Fri, 23 May 2025 05:00:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.828034
- Title: Simultaneous Modeling of Protein Conformation and Dynamics via Autoregression
- Title(参考訳): 自己回帰によるタンパク質コンフォーメーションとダイナミクスの同時モデリング
- Authors: Yuning Shen, Lihao Wang, Huizhuo Yuan, Yan Wang, Bangji Yang, Quanquan Gu,
- Abstract要約: ConfRoverは自己回帰モデルであり、MD軌道からタンパク質のコンホメーションとダイナミクスを同時に学習する。
時間に依存しないサンプリングと時間に依存しないサンプリングの両方をサポートする。
大規模タンパク質MDデータセットであるATLASの実験は、我々のモデルの有効性を実証している。
- 参考スコア(独自算出の注目度): 45.49904590474368
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Understanding protein dynamics is critical for elucidating their biological functions. The increasing availability of molecular dynamics (MD) data enables the training of deep generative models to efficiently explore the conformational space of proteins. However, existing approaches either fail to explicitly capture the temporal dependencies between conformations or do not support direct generation of time-independent samples. To address these limitations, we introduce ConfRover, an autoregressive model that simultaneously learns protein conformation and dynamics from MD trajectories, supporting both time-dependent and time-independent sampling. At the core of our model is a modular architecture comprising: (i) an encoding layer, adapted from protein folding models, that embeds protein-specific information and conformation at each time frame into a latent space; (ii) a temporal module, a sequence model that captures conformational dynamics across frames; and (iii) an SE(3) diffusion model as the structure decoder, generating conformations in continuous space. Experiments on ATLAS, a large-scale protein MD dataset of diverse structures, demonstrate the effectiveness of our model in learning conformational dynamics and supporting a wide range of downstream tasks. ConfRover is the first model to sample both protein conformations and trajectories within a single framework, offering a novel and flexible approach for learning from protein MD data.
- Abstract(参考訳): タンパク質の動態を理解することは、その生物学的機能を解明するために重要である。
分子動力学(MD)データの増加により、深層生成モデルのトレーニングにより、タンパク質のコンフォメーション空間を効率的に探索することができる。
しかし、既存のアプローチでは、コンフォーメーション間の時間的依存関係を明示的にキャプチャできないか、時間に依存しないサンプルの直接生成をサポートしない。
これらの制約に対処するため,MDトラジェクトリからタンパク質のコンフォメーションと動的構造を同時に学習する自己回帰モデルConfRoverを導入し,時間依存サンプリングと時間非依存サンプリングの両方をサポートする。
私たちのモデルの中核となるのは、以下のモジュールアーキテクチャです。
一 タンパク質の折り畳みモデルに適合し、各時間枠にタンパク質特有の情報及びコンフォメーションを埋め込んだ符号化層
(ii)時間モジュール、フレーム間のコンフォメーションダイナミクスをキャプチャするシーケンスモデル、及び
三 構造デコーダとしてのSE(3)拡散モデル、連続空間におけるコンフォメーションを生成する。
多様な構造の大規模タンパク質MDデータセットであるATLASの実験は、コンフォーメーションのダイナミクスを学習し、幅広い下流タスクをサポートする上で、我々のモデルの有効性を実証している。
ConfRoverは、単一のフレームワーク内でタンパク質コンホメーションとトラジェクトリの両方をサンプリングする最初のモデルであり、タンパク質MDデータから学習するための、新しく柔軟なアプローチを提供する。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - AlphaFolding: 4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance [18.90451943620277]
本研究では分子動力学(MD)シミュレーションデータを用いた動的タンパク質構造学習のための革新的4次元拡散モデルを提案する。
本モデルでは,32時間で最大256個のアミノ酸を含むタンパク質の動的3次元構造を予測できる。
論文 参考訳(メタデータ) (2024-08-22T14:12:50Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical
Coarse-graining SO(3)-Equivariant Autoencoders [1.8835495377767553]
天然タンパク質の3次元ネイティブ状態は、繰り返しおよび階層的なパターンを示す。
従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。
オフィチュス(Ophiuchus)は、全原子タンパク質構造を効率的に操作するSO(3)等価な粗粒化モデルである。
論文 参考訳(メタデータ) (2023-10-04T01:01:11Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。