論文の概要: Simultaneous Modeling of Protein Conformation and Dynamics via Autoregression
- arxiv url: http://arxiv.org/abs/2505.17478v1
- Date: Fri, 23 May 2025 05:00:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.828034
- Title: Simultaneous Modeling of Protein Conformation and Dynamics via Autoregression
- Title(参考訳): 自己回帰によるタンパク質コンフォーメーションとダイナミクスの同時モデリング
- Authors: Yuning Shen, Lihao Wang, Huizhuo Yuan, Yan Wang, Bangji Yang, Quanquan Gu,
- Abstract要約: ConfRoverは自己回帰モデルであり、MD軌道からタンパク質のコンホメーションとダイナミクスを同時に学習する。
時間に依存しないサンプリングと時間に依存しないサンプリングの両方をサポートする。
大規模タンパク質MDデータセットであるATLASの実験は、我々のモデルの有効性を実証している。
- 参考スコア(独自算出の注目度): 45.49904590474368
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Understanding protein dynamics is critical for elucidating their biological functions. The increasing availability of molecular dynamics (MD) data enables the training of deep generative models to efficiently explore the conformational space of proteins. However, existing approaches either fail to explicitly capture the temporal dependencies between conformations or do not support direct generation of time-independent samples. To address these limitations, we introduce ConfRover, an autoregressive model that simultaneously learns protein conformation and dynamics from MD trajectories, supporting both time-dependent and time-independent sampling. At the core of our model is a modular architecture comprising: (i) an encoding layer, adapted from protein folding models, that embeds protein-specific information and conformation at each time frame into a latent space; (ii) a temporal module, a sequence model that captures conformational dynamics across frames; and (iii) an SE(3) diffusion model as the structure decoder, generating conformations in continuous space. Experiments on ATLAS, a large-scale protein MD dataset of diverse structures, demonstrate the effectiveness of our model in learning conformational dynamics and supporting a wide range of downstream tasks. ConfRover is the first model to sample both protein conformations and trajectories within a single framework, offering a novel and flexible approach for learning from protein MD data.
- Abstract(参考訳): タンパク質の動態を理解することは、その生物学的機能を解明するために重要である。
分子動力学(MD)データの増加により、深層生成モデルのトレーニングにより、タンパク質のコンフォメーション空間を効率的に探索することができる。
しかし、既存のアプローチでは、コンフォーメーション間の時間的依存関係を明示的にキャプチャできないか、時間に依存しないサンプルの直接生成をサポートしない。
これらの制約に対処するため,MDトラジェクトリからタンパク質のコンフォメーションと動的構造を同時に学習する自己回帰モデルConfRoverを導入し,時間依存サンプリングと時間非依存サンプリングの両方をサポートする。
私たちのモデルの中核となるのは、以下のモジュールアーキテクチャです。
一 タンパク質の折り畳みモデルに適合し、各時間枠にタンパク質特有の情報及びコンフォメーションを埋め込んだ符号化層
(ii)時間モジュール、フレーム間のコンフォメーションダイナミクスをキャプチャするシーケンスモデル、及び
三 構造デコーダとしてのSE(3)拡散モデル、連続空間におけるコンフォメーションを生成する。
多様な構造の大規模タンパク質MDデータセットであるATLASの実験は、コンフォーメーションのダイナミクスを学習し、幅広い下流タスクをサポートする上で、我々のモデルの有効性を実証している。
ConfRoverは、単一のフレームワーク内でタンパク質コンホメーションとトラジェクトリの両方をサンプリングする最初のモデルであり、タンパク質MDデータから学習するための、新しく柔軟なアプローチを提供する。
関連論文リスト
- MoDyGAN: Combining Molecular Dynamics With GANs to Investigate Protein Conformational Space [0.0]
MoDyGANは、分子動力学シミュレーションと生成敵ネットワーク(GAN)を利用してタンパク質コンフォメーション空間を探索するパイプラインである。
MoDyGANには、ガウス分布をMD由来のタンパク質軌道にマッピングするジェネレータと、アンサンブル学習と二重識別器を組み合わせた精製モジュールが含まれている。
我々のアプローチの中心は、3Dタンパク質構造を2D行列に可逆的に変換する革新的な表現技術である。
以上の結果から,タンパク質をイメージライクなデータとして表現することは,生物分子シミュレーションに高度な深層学習技術を適用する新たな可能性を開くことが示唆された。
論文 参考訳(メタデータ) (2025-07-18T14:18:28Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - EquiJump: Protein Dynamics Simulation via SO(3)-Equivariant Stochastic Interpolants [13.493198442811865]
EquiJumpは移動可能なSO(3)-同変モデルで、全原子タンパク質の動力学シミュレーションの時間ステップを直接ブリッジする。
提案手法は様々なサンプリング手法を達成し,高速な折りたたみタンパク質の軌道データに基づく既存のモデルと比較した。
論文 参考訳(メタデータ) (2024-10-12T23:22:49Z) - AlphaFolding: 4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance [18.90451943620277]
本研究では分子動力学(MD)シミュレーションデータを用いた動的タンパク質構造学習のための革新的4次元拡散モデルを提案する。
本モデルでは,32時間で最大256個のアミノ酸を含むタンパク質の動的3次元構造を予測できる。
論文 参考訳(メタデータ) (2024-08-22T14:12:50Z) - Dynamic PDB: A New Dataset and a SE(3) Model Extension by Integrating Dynamic Behaviors and Physical Properties in Protein Structures [15.819618708991598]
約12.6Kタンパク質を含む大規模データセットであるDynamic PDBを導入する。
我々は、原子速度と力、ポテンシャルと運動エネルギー、シミュレーション環境の温度を含む、総合的な物理特性スイートを提供する。
本研究は, 軌道予測の課題に対して, 提案したデータセット上での最先端手法の評価を行う。
論文 参考訳(メタデータ) (2024-08-22T14:06:01Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical
Coarse-graining SO(3)-Equivariant Autoencoders [1.8835495377767553]
天然タンパク質の3次元ネイティブ状態は、繰り返しおよび階層的なパターンを示す。
従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。
オフィチュス(Ophiuchus)は、全原子タンパク質構造を効率的に操作するSO(3)等価な粗粒化モデルである。
論文 参考訳(メタデータ) (2023-10-04T01:01:11Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。