論文の概要: Improved motif-scaffolding with SE(3) flow matching
- arxiv url: http://arxiv.org/abs/2401.04082v1
- Date: Mon, 8 Jan 2024 18:38:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 13:54:40.279760
- Title: Improved motif-scaffolding with SE(3) flow matching
- Title(参考訳): se(3)フローマッチングによるモチーフカフォールディングの改善
- Authors: Jason Yim, Andrew Campbell, Emile Mathieu, Andrew Y. K. Foong, Michael
Gastegger, Jos\'e Jim\'enez-Luna, Sarah Lewis, Victor Garcia Satorras,
Bastiaan S. Veeling, Frank No\'e, Regina Barzilay, Tommi S. Jaakkola
- Abstract要約: 生成モデルは、様々なモチーフのために足場を設計することで、画期的な成功を収めました。
タンパク質のバックボーン生成のためのSE(3)フローマッチングモデルであるFrameFlowを拡張し,2つの相補的なアプローチでモチーフ・スキャフォールディングを行う。
- 参考スコア(独自算出の注目度): 54.82832841074558
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein design often begins with knowledge of a desired function from a motif
which motif-scaffolding aims to construct a functional protein around.
Recently, generative models have achieved breakthrough success in designing
scaffolds for a diverse range of motifs. However, the generated scaffolds tend
to lack structural diversity, which can hinder success in wet-lab validation.
In this work, we extend FrameFlow, an SE(3) flow matching model for protein
backbone generation, to perform motif-scaffolding with two complementary
approaches. The first is motif amortization, in which FrameFlow is trained with
the motif as input using a data augmentation strategy. The second is motif
guidance, which performs scaffolding using an estimate of the conditional score
from FrameFlow, and requires no additional training. Both approaches achieve an
equivalent or higher success rate than previous state-of-the-art methods, with
2.5 times more structurally diverse scaffolds. Code: https://github.com/
microsoft/frame-flow.
- Abstract(参考訳): タンパク質の設計は、しばしばモチーフから所望の機能の知識から始まり、モチーフ・スキャフォールディングは機能タンパク質を周囲に構築することを目的としている。
近年,多種多様なモチーフの足場設計において,生成モデルが画期的な成功を収めている。
しかし、生成された足場は構造的な多様性を欠く傾向にあり、ウェットラブ検証の成功を妨げる。
本研究では,タンパク質骨格生成のためのse(3)フローマッチングモデルであるframeflowを拡張し,相補的アプローチを用いてモチーフスキャフォールディングを行う。
1つ目はモチーフ・アモーティゼーションで、FrameFlowはデータ拡張戦略を使用して入力としてモチーフでトレーニングされる。
2つ目はモチーフガイダンスで、FrameFlowから条件スコアを推定してスキャフォールディングを実行し、追加のトレーニングを必要としない。
どちらのアプローチも、従来の最先端手法と同等あるいは高い成功率を達成し、構造的に多様な足場を持つ。
コード: https://github.com/ microsoft/frame-flow。
関連論文リスト
- Floating Anchor Diffusion Model for Multi-motif Scaffolding [44.568645532021804]
先行研究は、塗装や条件付き生成によってこの問題にアプローチする。
フローティングアンカー拡散(FADiff)モデルを提案する。
FADiffは、モチーフの存在を保証する拡散の過程において、厳格かつ独立してモチーフが浮かぶことを可能にする。
論文 参考訳(メタデータ) (2024-06-05T10:54:18Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - A Novel Bounding Box Regression Method for Single Object Tracking [0.0]
本稿では,2つの新しいバウンディングボックスレグレッションネットワーク(インセプションとデフォルマブル)を導入する。
実験およびアブレーション実験により、ODTrackにインストールされた初期モジュールは、3つのベンチマークで後者を上回る性能を示した。
論文 参考訳(メタデータ) (2024-05-16T21:09:45Z) - SE(3)-Stochastic Flow Matching for Protein Backbone Generation [54.951832422425454]
我々はFoldFlowを紹介した。FoldFlowは,3mathrmD$の剛性運動に対するフローマッチングパラダイムに基づく,モデリング能力向上のための新しい生成モデルである。
FoldFlow生成モデルのファミリーは、タンパク質の生成モデルに対する従来のアプローチよりもいくつかの利点を提供している。
論文 参考訳(メタデータ) (2023-10-03T19:24:24Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - Diffusion probabilistic modeling of protein backbones in 3D for the
motif-scaffolding problem [32.3917919535559]
現在の足場設計のための機械学習技術は、非現実的に小さな足場に限られるか、複数の多様な足場を作り出すのに苦労している。
本稿では,E(3)-同変グラフニューラルネットワークを用いて,多様で長いタンパク質のバックボーン構造の分布を学習することを提案する。
所与のモチーフに条件付き分布からスキャフォールドを効率よくサンプリングするSMCDiffを開発した。
論文 参考訳(メタデータ) (2022-06-08T18:35:08Z) - Benchmarking deep generative models for diverse antibody sequence design [18.515971640245997]
シーケンスのみから、あるいはシーケンスと構造を共同で学習する深層生成モデルは、このタスクにおいて印象的なパフォーマンスを示している。
最近提案されたタンパク質設計のための3つの深い生成フレームワークについて考察する: (AR) 配列ベースの自己回帰生成モデル、(GVP) 正確な構造ベースのグラフニューラルネットワーク、そして3次元折り畳みのファジィでスケールフリーな表現を利用するFold2Seq。
我々は,これらのモデルを,機能的含意に高い多様性を持つ設計配列を必要とする抗体配列の計算設計のタスクに基づいてベンチマークする。
論文 参考訳(メタデータ) (2021-11-12T16:23:32Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。