論文の概要: Learning Geometrically Disentangled Representations of Protein Folding
Simulations
- arxiv url: http://arxiv.org/abs/2205.10423v1
- Date: Fri, 20 May 2022 19:38:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-05 22:32:13.386825
- Title: Learning Geometrically Disentangled Representations of Protein Folding
Simulations
- Title(参考訳): タンパク質フォールディングシミュレーションの幾何学的アンタングル表現の学習
- Authors: N. Joseph Tatro, Payel Das, Pin-Yu Chen, Vijil Chenthamarakshan,
Rongjie Lai
- Abstract要約: この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
- 参考スコア(独自算出の注目度): 72.03095377508856
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Massive molecular simulations of drug-target proteins have been used as a
tool to understand disease mechanism and develop therapeutics. This work
focuses on learning a generative neural network on a structural ensemble of a
drug-target protein, e.g. SARS-CoV-2 Spike protein, obtained from
computationally expensive molecular simulations. Model tasks involve
characterizing the distinct structural fluctuations of the protein bound to
various drug molecules, as well as efficient generation of protein
conformations that can serve as an complement of a molecular simulation engine.
Specifically, we present a geometric autoencoder framework to learn separate
latent space encodings of the intrinsic and extrinsic geometries of the protein
structure. For this purpose, the proposed Protein Geometric AutoEncoder
(ProGAE) model is trained on the protein contact map and the orientation of the
backbone bonds of the protein. Using ProGAE latent embeddings, we reconstruct
and generate the conformational ensemble of a protein at or near the
experimental resolution, while gaining better interpretability and
controllability in term of protein structure generation from the learned latent
space. Additionally, ProGAE models are transferable to a different state of the
same protein or to a new protein of different size, where only the dense layer
decoding from the latent representation needs to be retrained. Results show
that our geometric learning-based method enjoys both accuracy and efficiency
for generating complex structural variations, charting the path toward scalable
and improved approaches for analyzing and enhancing high-cost simulations of
drug-target proteins.
- Abstract(参考訳): 薬物標的タンパク質の大規模分子シミュレーションは、疾患のメカニズムを理解し治療薬を開発するための道具として使われてきた。
本研究は、計算コストの高い分子シミュレーションから得られた薬物標的タンパク質(例えばsars-cov-2スパイクタンパク質)の構造的アンサンブルに基づく生成的ニューラルネットワークの学習に焦点を当てている。
モデル課題は、様々な薬物分子に結合するタンパク質の構造的変動を特徴づけることと、分子シミュレーションエンジンの補完となるタンパク質配座を効率的に生成することである。
具体的には,タンパク質構造の内在的および外在的ジオメトリの遅延空間符号化を学習するための幾何学的オートエンコーダフレームワークを提案する。
この目的のために、提案するタンパク質幾何オートエンコーダ(progae)モデルは、タンパク質の接触マップとタンパク質の骨格結合の配向に基づいて訓練される。
プロゲエ潜在性埋め込みを用いて,タンパク質のコンフォメーションアンサンブルを実験分解能付近で再構成し生成し,学習した潜在性空間からタンパク質構造生成の観点でより優れた解釈性と制御性を得る。
さらに、プロゲエモデルは、同じタンパク質の異なる状態または異なる大きさの新しいタンパク質に転送可能であり、そこでは潜在表現からデコードされる高密度層のみが再訓練される必要がある。
以上の結果から,本手法は複雑な構造変化を生成するための精度と効率の両立を図示し,薬物標的タンパク質の高コストシミュレーション解析と拡張のためのスケーラブルで改良されたアプローチへの道筋を示した。
関連論文リスト
- Long-context Protein Language Model [76.95505296417866]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文 参考訳(メタデータ) (2024-10-29T16:43:28Z) - Top-down machine learning of coarse-grained protein force-fields [2.1485350418225244]
我々の手法は、タンパク質を分子動力学でシミュレートし、その結果の軌道を利用してニューラルネットワーク電位を訓練することである。
注目すべきは、この方法はタンパク質のネイティブなコンフォメーションのみを必要とし、ラベル付きデータを必要としないことである。
マルコフ状態モデルを適用することで、シミュレーションされたタンパク質のネイティブな構造を粗い粒度のシミュレーションから予測することができる。
論文 参考訳(メタデータ) (2023-06-20T08:31:24Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Integration of Pre-trained Protein Language Models into Geometric Deep
Learning Networks [68.90692290665648]
我々は、タンパク質言語モデルから学んだ知識を、いくつかの最先端の幾何学的ネットワークに統合する。
以上の結果から,ベースラインを20%上回る総合的な改善が見られた。
強い証拠は、タンパク質言語モデルの知識を取り入れることで、幾何学的ネットワークの能力が著しく向上することを示している。
論文 参考訳(メタデータ) (2022-12-07T04:04:04Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z) - G-VAE, a Geometric Convolutional VAE for ProteinStructure Generation [41.66010308405784]
本稿では,3次元タンパク質構造の比較,変形,生成のための統合幾何学的ニューラルネットワーク手法を提案する。
本手法は, トレーニングデータの構造と異なり, 可塑性構造を生成することができる。
論文 参考訳(メタデータ) (2021-06-22T16:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。