論文の概要: Mask prior-guided denoising diffusion improves inverse protein folding
- arxiv url: http://arxiv.org/abs/2412.07815v1
- Date: Tue, 10 Dec 2024 09:10:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:01:07.419344
- Title: Mask prior-guided denoising diffusion improves inverse protein folding
- Title(参考訳): Mask pre-guided denoisingfusionは逆タンパク質の折り畳みを改善する
- Authors: Peizhen Bai, Filip Miljković, Xianyuan Liu, Leonardo De Maria, Rebecca Croasdale-Wood, Owen Rackham, Haiping Lu,
- Abstract要約: 逆タンパク質の折り畳みは、所望のタンパク質構造に折り畳むことのできる有効なアミノ酸配列を生成する。
逆タンパク質折り畳みのための構造的相互作用と残基相互作用の両方を捉える枠組みを提案する。
MapDiffは、ノイズを低減したアミノ酸配列を反復的に生成する離散拡散確率モデルである。
- 参考スコア(独自算出の注目度): 3.1373465343833704
- License:
- Abstract: Inverse protein folding generates valid amino acid sequences that can fold into a desired protein structure, with recent deep-learning advances showing significant potential and competitive performance. However, challenges remain in predicting highly uncertain regions, such as those with loops and disorders. To tackle such low-confidence residue prediction, we propose a \textbf{Ma}sk \textbf{p}rior-guided denoising \textbf{Diff}usion (\textbf{MapDiff}) framework that accurately captures both structural and residue interactions for inverse protein folding. MapDiff is a discrete diffusion probabilistic model that iteratively generates amino acid sequences with reduced noise, conditioned on a given protein backbone. To incorporate structural and residue interactions, we develop a graph-based denoising network with a mask prior pre-training strategy. Moreover, in the generative process, we combine the denoising diffusion implicit model with Monte-Carlo dropout to improve uncertainty estimation. Evaluation on four challenging sequence design benchmarks shows that MapDiff significantly outperforms state-of-the-art methods. Furthermore, the in-silico sequences generated by MapDiff closely resemble the physico-chemical and structural characteristics of native proteins across different protein families and architectures.
- Abstract(参考訳): 逆タンパク質の折り畳みは、所望のタンパク質構造に折り畳むことのできる有効なアミノ酸配列を生成し、近年のディープラーニングの進歩は、有意なポテンシャルと競争性能を示す。
しかし、ループや障害など、非常に不確実な領域の予測には依然として課題が残っている。
このような低信頼残差予測に対処するため、逆タンパク質の折り畳みに対する構造的相互作用と残差相互作用を正確に捉えるためのフレームワークである \textbf{Ma}sk \textbf{p}rior-guided denoising \textbf{Diff}usion (\textbf{MapDiff}) を提案する。
MapDiffは、特定のタンパク質のバックボーンに条件付けされたノイズを低減したアミノ酸配列を反復的に生成する離散拡散確率モデルである。
構造的および残余的な相互作用を組み込むため,事前学習前にマスク付きグラフベース denoising ネットワークを開発した。
さらに、生成過程において、デノナイズ拡散暗黙モデルとモンテカルロ・ドロップアウトを組み合わせ、不確実性推定を改善する。
4つの挑戦的なシーケンス設計ベンチマークの評価は、MapDiffが最先端の手法を大幅に上回っていることを示している。
さらに、MapDiffが生成するin-silico配列は、異なるタンパク質ファミリーおよびアーキテクチャのネイティブタンパク質の物理化学的および構造的特性によく似ている。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - DiAMoNDBack: Diffusion-denoising Autoregressive Model for
Non-Deterministic Backmapping of C{\alpha} Protein Traces [0.0]
DiAMoNDBack は非決定論的バックマッピングのための自己回帰デノナイジング拡散確率モデルである。
我々は、タンパク質データバンク(PDB)から65k以上の構造をトレーニングし、それをホールドアウトしたPDBテストセットにアプリケーションで検証する。
DiAMoNDBackは、フリーでオープンソースのPythonパッケージとして公開しています。
論文 参考訳(メタデータ) (2023-07-23T23:05:08Z) - Graph Denoising Diffusion for Inverse Protein Folding [15.06549999760776]
逆タンパク質の折り畳みは、その固有の一対多マッピング特性のために困難である。
本稿では,逆タンパク質の折り畳みに対する拡散モデルを提案する。
本モデルは,シークエンスリカバリにおける一般的なベースライン手法のセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-06-29T09:55:30Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Pre-Training Protein Encoder via Siamese Sequence-Structure Diffusion
Trajectory Prediction [29.375830561817047]
タンパク質の自己教師付き事前学習法が近年注目され、ほとんどのアプローチはタンパク質配列または構造に焦点をあてている。
配列構造共分散モデルを用いて,タンパク質エンコーダを事前学習するためのDiffPreT手法を提案する。
我々は,シムズ拡散軌道予測(SiamDiff)と呼ばれる手法によりDiffPreTを強化し,タンパク質の異なるコンホメータ間の相関を捉える。
論文 参考訳(メタデータ) (2023-01-28T02:48:20Z) - Protein structure generation via folding diffusion [16.12124223972183]
本稿では,タンパク質のバックボーン構造を設計する拡散モデルを提案する。
ランダムな展開状態から安定な折り畳み構造へデノイングすることで、新しい構造を生成する。
有用な資源として、タンパク質構造拡散のための最初のオープンソースおよび訓練されたモデルをリリースする。
論文 参考訳(メタデータ) (2022-09-30T17:35:53Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。