論文の概要: Scalable Normalizing Flows Enable Boltzmann Generators for
Macromolecules
- arxiv url: http://arxiv.org/abs/2401.04246v1
- Date: Mon, 8 Jan 2024 21:42:29 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 18:22:16.392368
- Title: Scalable Normalizing Flows Enable Boltzmann Generators for
Macromolecules
- Title(参考訳): スケーラブルな正規化フローによるマクロ分子のボルツマン生成
- Authors: Joseph C. Kim, David Bloore, Karan Kapoor, Jun Feng, Ming-Hong Hao,
Mengdi Wang
- Abstract要約: 内部座標で定義されたタンパク質のコンフォメーション分布を効率的に学習するために,分割チャネルとゲートアテンションを利用する新しいフローアーキテクチャを提案する。
2-ワッサーシュタイン損失を利用することで、最大可能性トレーニングからエネルギーベーストレーニングへの移行を円滑にすることができることを示す。
ビリンヘッドピースHP35(nle-nle),35-residueサブドメイン,56-residueタンパク質Gのモデルとトレーニング戦略について検討した。
- 参考スコア(独自算出の注目度): 31.01579163540794
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Boltzmann distribution of a protein provides a roadmap to all of its
functional states. Normalizing flows are a promising tool for modeling this
distribution, but current methods are intractable for typical pharmacological
targets; they become computationally intractable due to the size of the system,
heterogeneity of intra-molecular potential energy, and long-range interactions.
To remedy these issues, we present a novel flow architecture that utilizes
split channels and gated attention to efficiently learn the conformational
distribution of proteins defined by internal coordinates. We show that by
utilizing a 2-Wasserstein loss, one can smooth the transition from maximum
likelihood training to energy-based training, enabling the training of
Boltzmann Generators for macromolecules. We evaluate our model and training
strategy on villin headpiece HP35(nle-nle), a 35-residue subdomain, and protein
G, a 56-residue protein. We demonstrate that standard architectures and
training strategies, such as maximum likelihood alone, fail while our novel
architecture and multi-stage training strategy are able to model the
conformational distributions of protein G and HP35.
- Abstract(参考訳): タンパク質のボルツマン分布は、その全ての機能状態へのロードマップを提供する。
正規化フローは、この分布をモデル化するための有望なツールであるが、現在の手法は典型的な薬理学的な対象に対して難解であり、それらはシステムのサイズ、分子内ポテンシャルエネルギーの不均一性、長距離相互作用によって計算的に難解になる。
そこで本研究では,スプリットチャネルを応用し,内部座標で定義されたタンパク質のコンフォメーション分布を効率的に学習するための新しいフローアーキテクチャを提案する。
2-wasserstein損失を利用することで,最大確率トレーニングからエネルギーベーストレーニングへの移行を円滑に行うことができ,マクロ分子に対するボルツマンジェネレータのトレーニングが可能となる。
ビリンヘッドピースHP35(nle-nle),35-residueサブドメイン,56-residueタンパク質Gのモデルとトレーニング戦略について検討した。
我々は,新しいアーキテクチャと多段階のトレーニング戦略がタンパク質gとhp35のコンフォメーション分布をモデル化できるのに対し,標準アーキテクチャとトレーニング戦略,例えば最大可能性単独では失敗することを実証する。
関連論文リスト
- Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - Conditional Normalizing Flows for Active Learning of Coarse-Grained
Molecular Representations [0.8158530638728501]
フローの正規化のような生成機械学習手法は、サンプルなしでボルツマン分布を直接学習するために使われてきた。
本研究では,この問題を細粒度と粗粒度という2つのレベルに分けることで,この問題に対処する。
構成空間を探索するために,フローを更新し,必要時にのみ全原子ポテンシャルエネルギー評価を行うことのできる,能動学習による粗粒度シミュレーションを用いる。
論文 参考訳(メタデータ) (2024-02-02T07:44:26Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Navigating protein landscapes with a machine-learned transferable
coarse-grained model [29.252004942896875]
同様の予測性能を持つ粗粒度(CG)モデルは、長年にわたる課題である。
ケミカルトランスポータビリティを持つボトムアップCG力場を開発し,新しい配列の分子動力学に利用することができる。
本モデルでは, 折り畳み構造, 中間体, メタスタブル折り畳み型および折り畳み型流域, 内在的に不規則なタンパク質のゆらぎの予測に成功している。
論文 参考訳(メタデータ) (2023-10-27T17:10:23Z) - SE(3)-Stochastic Flow Matching for Protein Backbone Generation [54.951832422425454]
我々はFoldFlowを紹介した。FoldFlowは,3mathrmD$の剛性運動に対するフローマッチングパラダイムに基づく,モデリング能力向上のための新しい生成モデルである。
FoldFlow生成モデルのファミリーは、タンパク質の生成モデルに対する従来のアプローチよりもいくつかの利点を提供している。
論文 参考訳(メタデータ) (2023-10-03T19:24:24Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Differentiable Rotamer Sampling with Molecular Force Fields [4.081926213322809]
ボルツマン発生器は分子動力学の代替として提案されている。
ボルツマン生成法は, 従来のMDを複素高分子に置き換えるには十分迅速であることを示す。
ニューラルネットワークを用いた分子エネルギー景観探索のための包括的なツールキットを提供する。
論文 参考訳(メタデータ) (2023-02-22T15:12:28Z) - Rigid Body Flows for Sampling Molecular Crystal Structures [4.368185344922342]
三次元空間における複数物体の位置と向きをモデル化するための新しいタイプの正規化フローを提案する。
まず、単位四元数群上の滑らかで表現力のある流れを定義し、剛体の連続的な回転運動を捉える。
TIP4P水モデルでは,外部磁場における四面体系の多モード密度と氷XI相の2つの分子例に対してボルツマン発電機を訓練して評価を行った。
論文 参考訳(メタデータ) (2023-01-26T19:07:40Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。