論文の概要: SE(3)-Stochastic Flow Matching for Protein Backbone Generation
- arxiv url: http://arxiv.org/abs/2310.02391v2
- Date: Thu, 19 Oct 2023 23:21:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 02:54:00.320912
- Title: SE(3)-Stochastic Flow Matching for Protein Backbone Generation
- Title(参考訳): SE(3)-Stochastic Flow Matching for protein Backbone Generation (特集 バイオサイバネティックスとバイオサイバネティックス)
- Authors: Avishek Joey Bose, Tara Akhound-Sadegh, Kilian Fatras, Guillaume
Huguet, Jarrid Rector-Brooks, Cheng-Hao Liu, Andrei Cristian Nica, Maksym
Korablyov, Michael Bronstein, and Alexander Tong
- Abstract要約: 本稿では,3textD$の剛性運動に対するフローマッチングパラダイムに基づく,モデリング能力向上のための新しい生成モデルについて紹介する。
我々のモデルは、タンパク質の生成的モデリングに対するこれまでのアプローチに対して、いくつかの重要な利点を提供している。
- 参考スコア(独自算出の注目度): 54.951832422425454
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The computational design of novel protein structures has the potential to
impact numerous scientific disciplines greatly. Toward this goal, we introduce
$\text{FoldFlow}$ a series of novel generative models of increasing modeling
power based on the flow-matching paradigm over $3\text{D}$ rigid motions --
i.e. the group $\text{SE(3)}$ -- enabling accurate modeling of protein
backbones. We first introduce $\text{FoldFlow-Base}$, a simulation-free
approach to learning deterministic continuous-time dynamics and matching
invariant target distributions on $\text{SE(3)}$. We next accelerate training
by incorporating Riemannian optimal transport to create $\text{FoldFlow-OT}$,
leading to the construction of both more simple and stable flows. Finally, we
design $\text{FoldFlow-SFM}$ coupling both Riemannian OT and simulation-free
training to learn stochastic continuous-time dynamics over $\text{SE(3)}$. Our
family of $\text{FoldFlow}$ generative models offer several key advantages over
previous approaches to the generative modeling of proteins: they are more
stable and faster to train than diffusion-based approaches, and our models
enjoy the ability to map any invariant source distribution to any invariant
target distribution over $\text{SE(3)}$. Empirically, we validate our FoldFlow
models on protein backbone generation of up to $300$ amino acids leading to
high-quality designable, diverse, and novel samples.
- Abstract(参考訳): 新規タンパク質構造の計算設計は、多くの科学分野に大きな影響を与える可能性がある。
この目的に向けて、$\text{foldflow}$という3ドルの厳格な動き(つまり、$\text{se(3)}$ --)よりもフローマッチングパラダイムに基づくモデリング能力を向上させる一連の新しい生成モデルを紹介します。
最初に$\text{foldflow-base}$を導入し、決定論的連続時間ダイナミクスを学習し、$\text{se(3)}$の不変目標分布をマッチングするためのシミュレーションフリーなアプローチを導入する。
次に、$\text{foldflow-ot}$を作成するためにリーマン最適トランスポートを組み込むことでトレーニングを加速し、より単純で安定したフローを構築する。
最後に、Riemannian OTとシミュレーションなしのトレーニングの両方を結合して$\text{FoldFlow-SFM}$を設計し、$\text{SE(3)}$上で確率的連続時間力学を学習する。
我々の生成モデルは、拡散ベースのアプローチよりも安定で訓練が速い、そして我々のモデルは、任意の不変なソース分布を$\text{SE(3)}$上の不変なターゲット分布にマッピングする能力を持っている。
実験により、FoldFlowモデルを用いて、最大300ドルのアミノ酸のタンパク質のバックボーン生成を検証し、高品質で多種多様で斬新なサンプルを作成しました。
関連論文リスト
- P2DFlow: A Protein Ensemble Generative Model with SE(3) Flow Matching [8.620021796568087]
P2DFlowはSE(3)フローマッチングに基づく生成モデルであり、タンパク質の構造的アンサンブルを予測する。
ATLASのMDデータセットでトレーニングと評価を行うと、P2DFlowは他のベースラインモデルよりも優れている。
タンパク質分子シミュレーションの潜在的プロキシ剤として、P2DFlowによって生成された高品質なアンサンブルは、様々なシナリオでタンパク質の機能を理解するのに大いに役立つ。
論文 参考訳(メタデータ) (2024-11-26T08:10:12Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - FINE: Factorizing Knowledge for Initialization of Variable-sized Diffusion Models [35.40065954148091]
FINEはLearngeneフレームワークに基づく、事前訓練されたモデルを利用した下流ネットワークの初期化手法である。
事前学習された知識を行列の積(例えば$U$, $Sigma$, $V$)に分解する。
これは、特により小さなモデルにおいて、直接事前訓練よりも一貫して優れており、可変モデルのサイズで最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-09-28T08:57:17Z) - Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding [84.3224556294803]
拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然なデザイン空間を捉えるのに優れている。
これらの設計空間の自然性を保ちながら、下流の報酬関数を最適化することを目指している。
提案アルゴリズムは,中間雑音状態が将来高い報酬をもたらすことの先駆けとして,ソフトバリュー関数を統合する。
論文 参考訳(メタデータ) (2024-08-15T16:47:59Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - Enhancing lattice kinetic schemes for fluid dynamics with Lattice-Equivariant Neural Networks [79.16635054977068]
我々はLattice-Equivariant Neural Networks (LENNs)と呼ばれる新しい同変ニューラルネットワークのクラスを提案する。
我々の手法は、ニューラルネットワークに基づく代理モデルLattice Boltzmann衝突作用素の学習を目的とした、最近導入されたフレームワーク内で開発されている。
本研究は,実世界のシミュレーションにおける機械学習強化Lattice Boltzmann CFDの実用化に向けて展開する。
論文 参考訳(メタデータ) (2024-05-22T17:23:15Z) - F$^3$low: Frame-to-Frame Coarse-grained Molecular Dynamics with SE(3) Guided Flow Matching [43.607506885746155]
本稿では,改良サンプリングのためのアンダーラインフローマッチング(F$3$low)を用いた生成モデルを提案する。
SE(3)上の無力な生成パラダイムにより、多種多様なコンフォメーションを迅速に生成する能力は、効率的なサンプリング方法への道を開く。
論文 参考訳(メタデータ) (2024-05-01T04:53:14Z) - AlphaFold Meets Flow Matching for Generating Protein Ensembles [11.1639408863378]
本研究では,タンパク質のコンフォメーション・ランドスケープを学習・サンプリングするためのフローベース生成モデリング手法を開発した。
提案手法はAlphaFoldとMSAサブサンプリングと比較して精度と多様性の組合せが優れている。
本手法は,MD軌道の再現よりも高速な壁面収束により,静的なPDB構造を多様化することができる。
論文 参考訳(メタデータ) (2024-02-07T13:44:47Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。