論文の概要: The Latent Road to Atoms: Backmapping Coarse-grained Protein Structures with Latent Diffusion
- arxiv url: http://arxiv.org/abs/2410.13264v1
- Date: Thu, 17 Oct 2024 06:38:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:21:09.489911
- Title: The Latent Road to Atoms: Backmapping Coarse-grained Protein Structures with Latent Diffusion
- Title(参考訳): 原子への潜航路:潜航拡散を伴う粗粒タンパク質構造のバックマッピング
- Authors: Xu Han, Yuancheng Sun, Kai Chen, Kang Liu, Qiwei Ye,
- Abstract要約: 潜伏拡散バックマッピング(LDB)は、これらの課題に対処するために潜伏空間内での拡散をデノナイズする新しいアプローチである。
3つの異なるタンパク質データセット上でLDBの最先端性能を評価する。
計算生物学におけるCGシミュレーションと原子レベル解析のギャップを効果的に埋め、LDBをバックマッピングのための強力でスケーラブルなアプローチとして位置づけた。
- 参考スコア(独自算出の注目度): 19.85659309869674
- License:
- Abstract: Coarse-grained(CG) molecular dynamics simulations offer computational efficiency for exploring protein conformational ensembles and thermodynamic properties. Though coarse representations enable large-scale simulations across extended temporal and spatial ranges, the sacrifice of atomic-level details limits their utility in tasks such as ligand docking and protein-protein interaction prediction. Backmapping, the process of reconstructing all-atom structures from coarse-grained representations, is crucial for recovering these fine details. While recent machine learning methods have made strides in protein structure generation, challenges persist in reconstructing diverse atomistic conformations that maintain geometric accuracy and chemical validity. In this paper, we present Latent Diffusion Backmapping (LDB), a novel approach leveraging denoising diffusion within latent space to address these challenges. By combining discrete latent encoding with diffusion, LDB bypasses the need for equivariant and internal coordinate manipulation, significantly simplifying the training and sampling processes as well as facilitating better and wider exploration in configuration space. We evaluate LDB's state-of-the-art performance on three distinct protein datasets, demonstrating its ability to efficiently reconstruct structures with high structural accuracy and chemical validity. Moreover, LDB shows exceptional versatility in capturing diverse protein ensembles, highlighting its capability to explore intricate conformational spaces. Our results position LDB as a powerful and scalable approach for backmapping, effectively bridging the gap between CG simulations and atomic-level analyses in computational biology.
- Abstract(参考訳): 粗粒(CG)分子動力学シミュレーションは、タンパク質コンホメーションのアンサンブルと熱力学特性を探索するための計算効率を提供する。
粗い表現は時間的および空間的範囲をまたいだ大規模なシミュレーションを可能にするが、原子レベルの詳細の犠牲は、リガンドドッキングやタンパク質とタンパク質の相互作用予測といったタスクにおけるそれらの有用性を制限している。
粗い粒度の表現から全原子構造を再構築する過程であるバックマッピングは、これらの細部を復元するために重要である。
近年の機械学習手法ではタンパク質構造の生成が進んでいるが、幾何学的精度と化学的妥当性を維持する様々な原子構造を再構築する上での課題が続いている。
本稿では,遅延拡散バックマッピング(LDB)を提案する。
離散ラテント符号化と拡散を組み合わせることで、LDBは同変および内部座標操作の必要性を回避し、トレーニングとサンプリングプロセスを大幅に単純化し、構成空間におけるより優れたより広範な探索を容易にする。
3つの異なるタンパク質データセットに対してLDBの最先端性能を評価し、構造的精度と化学的妥当性で効率的に構造を再構築できることを実証した。
さらに、LDBは多様なタンパク質アンサンブルを取り込み、複雑なコンフォメーション空間を探索する能力を強調している。
計算生物学におけるCGシミュレーションと原子レベル解析のギャップを効果的に埋め、LDBをバックマッピングのための強力でスケーラブルなアプローチとして位置づけた。
関連論文リスト
- Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Deep Signature: Characterization of Large-Scale Molecular Dynamics [29.67824486345836]
ディープシグナチャ(Deep Signature)は、複雑な力学と原子間相互作用を特徴付ける、計算的に抽出可能な新しいフレームワークである。
提案手法では,協調力学を局所的に集約してシステムのサイズを小さくするソフトスペクトルクラスタリングと,非滑らかな対話力学のグローバルな評価を行うシグネチャ変換を取り入れた。
論文 参考訳(メタデータ) (2024-10-03T16:37:48Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - DiAMoNDBack: Diffusion-denoising Autoregressive Model for
Non-Deterministic Backmapping of C{\alpha} Protein Traces [0.0]
DiAMoNDBack は非決定論的バックマッピングのための自己回帰デノナイジング拡散確率モデルである。
我々は、タンパク質データバンク(PDB)から65k以上の構造をトレーニングし、それをホールドアウトしたPDBテストセットにアプリケーションで検証する。
DiAMoNDBackは、フリーでオープンソースのPythonパッケージとして公開しています。
論文 参考訳(メタデータ) (2023-07-23T23:05:08Z) - Chemically Transferable Generative Backmapping of Coarse-Grained
Proteins [0.0]
粗粒化(CG)は、原子の集合を特異なビーズとしてシミュレートすることでタンパク質力学のシミュレーションを加速する。
バックマッピングは、失われた原子論的な詳細をCG表現から取り戻すという逆の操作である。
この研究は、CGタンパク質表現のための高速で、転送可能で、信頼性の高い生成バックマッピングツールを構築する。
論文 参考訳(メタデータ) (2023-03-02T20:51:57Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。