論文の概要: AlphaFold Meets Flow Matching for Generating Protein Ensembles
- arxiv url: http://arxiv.org/abs/2402.04845v1
- Date: Wed, 7 Feb 2024 13:44:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 15:14:35.382701
- Title: AlphaFold Meets Flow Matching for Generating Protein Ensembles
- Title(参考訳): AlphaFoldがタンパク質アンサンブル生成のためのフローマッチングを発表
- Authors: Bowen Jing, Bonnie Berger, Tommi Jaakkola
- Abstract要約: 本研究では,タンパク質のコンフォメーション・ランドスケープを学習・サンプリングするためのフローベース生成モデリング手法を開発した。
提案手法はAlphaFoldとMSAサブサンプリングと比較して精度と多様性の組合せが優れている。
本手法は,MD軌道の再現よりも高速な壁面収束により,静的なPDB構造を多様化することができる。
- 参考スコア(独自算出の注目度): 12.54715076335456
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The biological functions of proteins often depend on dynamic structural
ensembles. In this work, we develop a flow-based generative modeling approach
for learning and sampling the conformational landscapes of proteins. We
repurpose highly accurate single-state predictors such as AlphaFold and ESMFold
and fine-tune them under a custom flow matching framework to obtain
sequence-conditoned generative models of protein structure called AlphaFlow and
ESMFlow. When trained and evaluated on the PDB, our method provides a superior
combination of precision and diversity compared to AlphaFold with MSA
subsampling. When further trained on ensembles from all-atom MD, our method
accurately captures conformational flexibility, positional distributions, and
higher-order ensemble observables for unseen proteins. Moreover, our method can
diversify a static PDB structure with faster wall-clock convergence to certain
equilibrium properties than replicate MD trajectories, demonstrating its
potential as a proxy for expensive physics-based simulations. Code is available
at https://github.com/bjing2016/alphaflow.
- Abstract(参考訳): タンパク質の生物学的機能はしばしば動的構造的アンサンブルに依存する。
本研究では,タンパク質のコンフォメーション・ランドスケープを学習・サンプリングするためのフローベース生成モデリング手法を開発する。
そこで我々は,AlphaFold や ESMFold のような高精度な単一状態予測器をカスタムフローマッチングフレームワークの下で微調整し,AlphaFlow や ESMFlow と呼ばれるタンパク質構造の配列決定生成モデルを得る。
PDBをトレーニングし評価すると,本手法はAlphaFoldとMSAサブサンプリングと比較して精度と多様性の優れた組み合わせを提供する。
本手法では,全原子MDのアンサンブルのさらなる訓練を行ない,コンフォメーションの柔軟性,位置分布,高次アンサンブル観測が可能となる。
さらに,提案手法は,MD軌道の再現よりも高速な壁面収束による静的PDB構造を多様化し,高コストな物理シミュレーションのプロキシとしての可能性を示す。
コードはhttps://github.com/bjing2016/alphaflowで入手できる。
関連論文リスト
- Diffusion Language Models Are Versatile Protein Learners [80.51049288791717]
拡散タンパク言語モデル (DPLM) は、タンパク質配列の強力な生成および予測能力を示す多用途タンパク言語モデルである。
まず, 自己制御型離散拡散確率フレームワークを用いて, 進化的タンパク質配列からのスケーラブルDPLMの事前学習を行った。
プレトレーニング後、DPLMは非条件生成のための構造的に可塑性で新規で多様なタンパク質配列を生成する能力を示す。
論文 参考訳(メタデータ) (2024-02-28T18:57:56Z) - SE(3)-Stochastic Flow Matching for Protein Backbone Generation [54.951832422425454]
本稿では,3textD$の剛性運動に対するフローマッチングパラダイムに基づく,モデリング能力向上のための新しい生成モデルについて紹介する。
我々のモデルは、タンパク質の生成的モデリングに対するこれまでのアプローチに対して、いくつかの重要な利点を提供している。
論文 参考訳(メタデータ) (2023-10-03T19:24:24Z) - Target-aware Variational Auto-encoders for Ligand Generation with
Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。
これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文 参考訳(メタデータ) (2023-08-02T12:08:17Z) - Str2Str: A Score-based Framework for Zero-shot Protein Conformation
Sampling [23.74897713386661]
タンパク質の動的性質は、その生物学的機能や性質を決定するために重要である。
既存の学習ベースのアプローチでは、直接サンプリングを行うが、トレーニングにはターゲット固有のシミュレーションデータに大きく依存する。
ゼロショットコンフォーメーションサンプリングが可能な新しい構造間翻訳フレームワークStr2Strを提案する。
論文 参考訳(メタデータ) (2023-06-05T15:19:06Z) - EigenFold: Generative Protein Structure Prediction with Diffusion Models [10.24107243529341]
EigenFoldは、特定のタンパク質配列から構造分布をサンプリングする拡散生成モデリングフレームワークである。
最近のCAMEOターゲットでは、EigenFoldは0.84の中央値TMSスコアを達成し、モデルの不確実性のより包括的な画像を提供する。
論文 参考訳(メタデータ) (2023-04-05T02:46:13Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction
with a Graph-Based Deep Learning Model [33.92165575735532]
タンパク質-リガンド結合親和性の正確な予測は、構造に基づく薬物設計において重要な課題である。
そこで我々は,3,218種類のタンパク質-リガンド複合体を含むMDデータセットをキュレートし,グラフに基づくディープラーニングモデルDynaformerを開発した。
ダイナフォーマーはMD軌道からタンパク質-リガンド相互作用の幾何学的特徴を学習することにより、結合親和性を正確に予測することができた。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z) - HelixFold-Single: MSA-free Protein Structure Prediction by Using Protein
Language Model as an Alternative [61.984700682903096]
HelixFold-Singleは、大規模なタンパク質言語モデルとAlphaFold2の優れた幾何学的学習能力を組み合わせるために提案されている。
提案手法は,数千万の一次配列を持つ大規模タンパク質言語モデルを事前学習する。
我々は、一次系列のみから原子の3次元座標を予測するために、エンドツーエンドの微分可能なモデルを得る。
論文 参考訳(メタデータ) (2022-07-28T07:30:33Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。