論文の概要: Variational embedding of protein folding simulations using gaussian
mixture variational autoencoders
- arxiv url: http://arxiv.org/abs/2108.12493v1
- Date: Fri, 27 Aug 2021 20:31:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-01 09:49:24.750854
- Title: Variational embedding of protein folding simulations using gaussian
mixture variational autoencoders
- Title(参考訳): gaussian mixture variational autoencoderを用いたタンパク質折り畳みシミュレーションの変分埋め込み
- Authors: Mahdi Ghorbani, Samarjeet Prasad, Jeffery B. Klauda, Bernard R. Brooks
- Abstract要約: 生体分子配座の次元的低減とクラスタリングを同時に行う機械学習手法を考案する。
GMVAEはタンパク質の折りたたみによる自由エネルギー景観の少ない表現を学習できることを示す。
また, GMVAEの埋め込みは, 折り畳み状態と, 折り畳み状態と, 折り畳み状態との相似性を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conformational sampling of biomolecules using molecular dynamics simulations
often produces large amount of high dimensional data that makes it difficult to
interpret using conventional analysis techniques. Dimensionality reduction
methods are thus required to extract useful and relevant information. Here we
devise a machine learning method, Gaussian mixture variational autoencoder
(GMVAE) that can simultaneously perform dimensionality reduction and clustering
of biomolecular conformations in an unsupervised way. We show that GMVAE can
learn a reduced representation of the free energy landscape of protein folding
with highly separated clusters that correspond to the metastable states during
folding. Since GMVAE uses a mixture of Gaussians as the prior, it can directly
acknowledge the multi-basin nature of protein folding free-energy landscape. To
make the model end-to-end differentialble, we use a Gumbel-softmax
distribution. We test the model on three long-timescale protein folding
trajectories and show that GMVAE embedding resembles the folding funnel with
folded states down the funnel and unfolded states outer in the funnel path.
Additionally, we show that the latent space of GMVAE can be used for kinetic
analysis and Markov state models built on this embedding produce folding and
unfolding timescales that are in close agreement with other rigorous dynamical
embeddings such as time independent component analysis (TICA).
- Abstract(参考訳): 分子動力学シミュレーションを用いた生体分子のコンフォーマルサンプリングは、しばしば大量の高次元データを生成するため、従来の解析手法では解釈が困難である。
したがって,有用かつ関連性の高い情報を抽出するために次元化手法が必要である。
そこで我々は,生体分子配座の次元的縮小とクラスタリングを同時に行うことができる機械学習手法,ガウス混合変分オートエンコーダ(GMVAE)を考案する。
GMVAEはタンパク質の折りたたみ時の準安定状態に対応する高度に分離されたクラスターで、タンパク質の折りたたみの自由エネルギー景観の少ない表現を学習できることを示す。
GMVAEはガウスの混合物を前者に用いているため、タンパク質の折り畳み自由エネルギー景観のマルチベースの性質を直接認識することができる。
モデルをエンドツーエンドで微分可能にするために、Gumbel-softmax分布を用いる。
本モデルでは, 3つの長期的タンパク質の折りたたみ軌道上で実験を行い, GMVAEの埋め込みは, 折りたたみ状態と, 折りたたみ状態との相似性を示した。
さらに, GMVAEの潜伏空間を運動解析に利用し, この埋め込み上に構築されたマルコフ状態モデルが, 時間独立成分分析(TICA)などの厳密な動的埋め込みと密に一致した折り畳みおよび展開時間スケールを生成することを示す。
関連論文リスト
- Adaptive Fuzzy C-Means with Graph Embedding [84.47075244116782]
ファジィクラスタリングアルゴリズムは、大まかに2つの主要なグループに分類できる: ファジィC平均法(FCM)と混合モデルに基づく方法。
本稿では,FCMを用いたクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2024-05-22T08:15:50Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - Navigating protein landscapes with a machine-learned transferable
coarse-grained model [29.252004942896875]
同様の予測性能を持つ粗粒度(CG)モデルは、長年にわたる課題である。
ケミカルトランスポータビリティを持つボトムアップCG力場を開発し,新しい配列の分子動力学に利用することができる。
本モデルでは, 折り畳み構造, 中間体, メタスタブル折り畳み型および折り畳み型流域, 内在的に不規則なタンパク質のゆらぎの予測に成功している。
論文 参考訳(メタデータ) (2023-10-27T17:10:23Z) - Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。
これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文 参考訳(メタデータ) (2023-07-11T16:51:38Z) - Implicit Transfer Operator Learning: Multiple Time-Resolution Surrogates
for Molecular Dynamics [8.35780131268962]
シミュレーションプロセスのサロゲートを複数の時間分解能で学習するフレームワークであるImplict Transfer Operator (ITO) Learningを提案する。
また、全原子分子動力学を定量的にモデル化できる粗粒CG-SE3-ITOモデルを提案する。
論文 参考訳(メタデータ) (2023-05-29T12:19:41Z) - Latent Space Diffusion Models of Cryo-EM Structures [6.968705314671148]
我々は、CryoDRGNフレームワークにおいて、表現的で学習可能な拡散モデルをトレーニングする。
データ分布の正確なモデルを学習することにより、生成モデリング、サンプリング、分布解析のツールを解放する。
論文 参考訳(メタデータ) (2022-11-25T15:17:10Z) - GANs and Closures: Micro-Macro Consistency in Multiscale Modeling [0.0]
本稿では,物理シミュレーションとバイアス法を併用して,条件分布をサンプリングする手法を提案する。
このフレームワークは, マルチスケールSDE動的システムサンプリングを改善することができることを示すとともに, 複雑性が増大するシステムにも期待できることを示す。
論文 参考訳(メタデータ) (2022-08-23T03:45:39Z) - Automated analysis of continuum fields from atomistic simulations using
statistical machine learning [0.0]
我々は統計データマイニングと機械学習アルゴリズムを用いて、原子論シミュレーションにおける連続体変数の分析を自動化する手法を開発した。
本研究は, 総ひずみ, 弾性ひずみ, マイクロローテーションの3つの重要な場変数に着目した。
総ひずみ分布のピークをガウス混合モデルで同定し、オーバーフィッティング問題を回避する方法を示す。
論文 参考訳(メタデータ) (2022-06-16T10:05:43Z) - Equivariant Diffusion for Molecule Generation in 3D [74.289191525633]
この研究は、ユークリッド変換に同値な3次元の分子計算生成のための拡散モデルを導入する。
提案手法は, 従来の3次元分子生成法に比べて, 生成した試料の品質と訓練時の効率を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-31T12:52:25Z) - GeoDiff: a Geometric Diffusion Model for Molecular Conformation
Generation [102.85440102147267]
分子配座予測のための新しい生成モデルGeoDiffを提案する。
GeoDiffは、既存の最先端のアプローチよりも優れているか、あるいは同等であることを示す。
論文 参考訳(メタデータ) (2022-03-06T09:47:01Z) - A Rigorous Link Between Self-Organizing Maps and Gaussian Mixture Models [78.6363825307044]
本研究は、自己組織化マップ(SOM)とガウス混合モデル(GMM)の関係を数学的に扱うものである。
我々は,エネルギーベースSOMモデルを勾配勾配下降と解釈できることを示した。
このリンクはSOMsを生成確率モデルとして扱うことができ、SOMsを使用して外れ値を検出したりサンプリングしたりするための正式な正当性を与える。
論文 参考訳(メタデータ) (2020-09-24T14:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。