論文の概要: Improved motif-scaffolding with SE(3) flow matching
- arxiv url: http://arxiv.org/abs/2401.04082v2
- Date: Thu, 18 Jul 2024 22:17:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-23 00:06:44.457708
- Title: Improved motif-scaffolding with SE(3) flow matching
- Title(参考訳): SE(3)フローマッチングによるモチーフ・スキャフォールディングの改良
- Authors: Jason Yim, Andrew Campbell, Emile Mathieu, Andrew Y. K. Foong, Michael Gastegger, José Jiménez-Luna, Sarah Lewis, Victor Garcia Satorras, Bastiaan S. Veeling, Frank Noé, Regina Barzilay, Tommi S. Jaakkola,
- Abstract要約: タンパク質のバックボーン生成のためのSE(3)フローマッチングモデルであるFrameFlowを拡張し,2つの相補的なアプローチでモチーフ・スキャフォールディングを行う。
1つ目はモチーフ・アモーティゼーション(motif amortization)で、FrameFlowはデータ拡張戦略を使用してモチーフを入力としてトレーニングする。
2つ目はモチーフガイダンスで、追加のトレーニングなしでFrameFlowから条件スコアを推定して足場化を行う。
- 参考スコア(独自算出の注目度): 56.53693775654178
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein design often begins with the knowledge of a desired function from a motif which motif-scaffolding aims to construct a functional protein around. Recently, generative models have achieved breakthrough success in designing scaffolds for a range of motifs. However, generated scaffolds tend to lack structural diversity, which can hinder success in wet-lab validation. In this work, we extend FrameFlow, an SE(3) flow matching model for protein backbone generation, to perform motif-scaffolding with two complementary approaches. The first is motif amortization, in which FrameFlow is trained with the motif as input using a data augmentation strategy. The second is motif guidance, which performs scaffolding using an estimate of the conditional score from FrameFlow without additional training. On a benchmark of 24 biologically meaningful motifs, we show our method achieves 2.5 times more designable and unique motif-scaffolds compared to state-of-the-art. Code: https://github.com/microsoft/protein-frame-flow
- Abstract(参考訳): タンパク質の設計は、しばしばモチーフから所望の機能の知識から始まり、モチーフスキャフォールディングは機能タンパク質を周囲に構築することを目的としている。
近年、生成モデルは様々なモチーフのための足場の設計において画期的な成功を収めている。
しかし、生成された足場は構造的な多様性を欠く傾向にあり、ウェットラブ検証の成功を妨げる。
本研究では,タンパク質のバックボーン生成のためのSE(3)フローマッチングモデルであるFrameFlowを拡張し,2つの相補的なアプローチでモチーフ・スキャフォールディングを行う。
1つ目はモチーフ・アモーティゼーション(motif amortization)で、FrameFlowはデータ拡張戦略を使用してモチーフを入力としてトレーニングする。
2つ目はモチーフガイダンスで、追加のトレーニングなしでFrameFlowから条件スコアを推定して足場化を行う。
生物学的に意味のあるモチーフを24のベンチマークで評価した結果,本手法は最先端のモチーフ・スキャフォールドに比べて2.5倍も設計可能で,ユニークなモチーフ・スキャフォールドが得られることがわかった。
コード:https://github.com/microsoft/ protein-frame-flow
関連論文リスト
- Floating Anchor Diffusion Model for Multi-motif Scaffolding [44.568645532021804]
先行研究は、塗装や条件付き生成によってこの問題にアプローチする。
フローティングアンカー拡散(FADiff)モデルを提案する。
FADiffは、モチーフの存在を保証する拡散の過程において、厳格かつ独立してモチーフが浮かぶことを可能にする。
論文 参考訳(メタデータ) (2024-06-05T10:54:18Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - A Novel Bounding Box Regression Method for Single Object Tracking [0.0]
本稿では,2つの新しいバウンディングボックスレグレッションネットワーク(インセプションとデフォルマブル)を導入する。
実験およびアブレーション実験により、ODTrackにインストールされた初期モジュールは、3つのベンチマークで後者を上回る性能を示した。
論文 参考訳(メタデータ) (2024-05-16T21:09:45Z) - SE(3)-Stochastic Flow Matching for Protein Backbone Generation [54.951832422425454]
我々はFoldFlowを紹介した。FoldFlowは,3mathrmD$の剛性運動に対するフローマッチングパラダイムに基づく,モデリング能力向上のための新しい生成モデルである。
FoldFlow生成モデルのファミリーは、タンパク質の生成モデルに対する従来のアプローチよりもいくつかの利点を提供している。
論文 参考訳(メタデータ) (2023-10-03T19:24:24Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - Diffusion probabilistic modeling of protein backbones in 3D for the
motif-scaffolding problem [32.3917919535559]
現在の足場設計のための機械学習技術は、非現実的に小さな足場に限られるか、複数の多様な足場を作り出すのに苦労している。
本稿では,E(3)-同変グラフニューラルネットワークを用いて,多様で長いタンパク質のバックボーン構造の分布を学習することを提案する。
所与のモチーフに条件付き分布からスキャフォールドを効率よくサンプリングするSMCDiffを開発した。
論文 参考訳(メタデータ) (2022-06-08T18:35:08Z) - Benchmarking deep generative models for diverse antibody sequence design [18.515971640245997]
シーケンスのみから、あるいはシーケンスと構造を共同で学習する深層生成モデルは、このタスクにおいて印象的なパフォーマンスを示している。
最近提案されたタンパク質設計のための3つの深い生成フレームワークについて考察する: (AR) 配列ベースの自己回帰生成モデル、(GVP) 正確な構造ベースのグラフニューラルネットワーク、そして3次元折り畳みのファジィでスケールフリーな表現を利用するFold2Seq。
我々は,これらのモデルを,機能的含意に高い多様性を持つ設計配列を必要とする抗体配列の計算設計のタスクに基づいてベンチマークする。
論文 参考訳(メタデータ) (2021-11-12T16:23:32Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。