論文の概要: Graph Denoising Diffusion for Inverse Protein Folding
- arxiv url: http://arxiv.org/abs/2306.16819v1
- Date: Thu, 29 Jun 2023 09:55:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-30 13:58:26.544665
- Title: Graph Denoising Diffusion for Inverse Protein Folding
- Title(参考訳): 逆タンパク質フォールディングのためのグラフデノイング拡散
- Authors: Kai Yi, Bingxin Zhou, Yiqing Shen, Pietro Li\`o, Yu Guang Wang
- Abstract要約: 逆タンパク質の折り畳みは、その固有の一対多マッピング特性のために困難である。
本稿では,逆タンパク質の折り畳みに対する拡散モデルを提案する。
本モデルは,シークエンスリカバリにおける一般的なベースライン手法のセットに対して,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 2.2699159408903484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inverse protein folding is challenging due to its inherent one-to-many
mapping characteristic, where numerous possible amino acid sequences can fold
into a single, identical protein backbone. This task involves not only
identifying viable sequences but also representing the sheer diversity of
potential solutions. However, existing discriminative models, such as
transformer-based auto-regressive models, struggle to encapsulate the diverse
range of plausible solutions. In contrast, diffusion probabilistic models, as
an emerging genre of generative approaches, offer the potential to generate a
diverse set of sequence candidates for determined protein backbones. We propose
a novel graph denoising diffusion model for inverse protein folding, where a
given protein backbone guides the diffusion process on the corresponding amino
acid residue types. The model infers the joint distribution of amino acids
conditioned on the nodes' physiochemical properties and local environment.
Moreover, we utilize amino acid replacement matrices for the diffusion forward
process, encoding the biologically-meaningful prior knowledge of amino acids
from their spatial and sequential neighbors as well as themselves, which
reduces the sampling space of the generative process. Our model achieves
state-of-the-art performance over a set of popular baseline methods in sequence
recovery and exhibits great potential in generating diverse protein sequences
for a determined protein backbone structure.
- Abstract(参考訳): 逆タンパク質折り畳みは、多くの可能なアミノ酸配列が単一の同一のタンパク質バックボーンに折り畳むことができる、固有の一対多のマッピング特性のために難しい。
このタスクは、実行可能な列を識別するだけでなく、潜在的な解の多様性も表す。
しかし、トランスフォーマーベースの自己回帰モデルのような既存の差別モデルでは、多様な可算解をカプセル化することが困難である。
対照的に、拡散確率モデルは、生成的アプローチの新しいジャンルとして、決定されたタンパク質バックボーンの多様な配列候補を生成する可能性がある。
本稿では,逆タンパク質の折り畳みに対する新しい拡散モデルを提案する。そこでは,タンパク質のバックボーンが対応するアミノ酸残基の拡散過程を案内する。
本モデルでは, ノードの物理化学的性質と局所環境に基づくアミノ酸の結合分布を推定する。
さらに, 拡散前処理にアミノ酸置換マトリックスを用い, アミノ酸の生物学的に有意な事前知識をその空間的および逐次的隣人およびそれ自身から符号化することにより, 生成過程のサンプリング空間を減少させる。
本モデルでは, 一般的な塩基配列回復法に対して最先端のパフォーマンスを実現し, 決定されたタンパク質骨格構造に対して, 多様なタンパク質配列を生成できる可能性を示す。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-10-17T15:10:13Z) - Peptide Sequencing Via Protein Language Models [0.0]
アミノ酸の限られた配列の測定に基づいてペプチドの完全配列を決定するためのタンパク質言語モデルを提案する。
本手法は, 特定が困難であるアミノ酸を選択的にマスキングすることにより, 部分的シークエンシングデータをシミュレートする。
アミノ酸が4つしか知られていない場合、アミノ酸当たりの精度は90.5%に達する。
論文 参考訳(メタデータ) (2024-08-01T20:12:49Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - Diffusion on language model embeddings for protein sequence generation [0.5442686600296733]
連続拡散を利用したアミノ酸配列生成モデルであるDiMAを導入する。
優れたパフォーマンスをもたらす設計選択の影響を定量的に説明します。
我々のアプローチは、タンパク質空間の構造的および機能的多様性を正確に反映する、新規で多様なタンパク質配列を一貫して生成する。
論文 参考訳(メタデータ) (2024-03-06T14:15:20Z) - Diffusion Language Models Are Versatile Protein Learners [75.98083311705182]
本稿では,タンパク質配列の強い生成および予測能力を示す多目的なタンパク質言語モデルである拡散タンパク質言語モデル(DPLM)を紹介する。
まず, 自己制御型離散拡散確率フレームワークを用いて, 進化的タンパク質配列からのスケーラブルDPLMの事前学習を行った。
プレトレーニング後、DPLMは非条件生成のための構造的に可塑性で新規で多様なタンパク質配列を生成する能力を示す。
論文 参考訳(メタデータ) (2024-02-28T18:57:56Z) - Predicting mutational effects on protein-protein binding via a
side-chain diffusion probabilistic model [14.949807579474781]
SidechainDiffは、未ラベルな実験タンパク質構造を利用する表現学習に基づくアプローチである。
SidechainDiffは、側鎖の拡散に基づく最初の生成モデルであり、タンパク質のバックボーン構造の生成に主に焦点をあてた以前の試みと区別している。
論文 参考訳(メタデータ) (2023-10-30T15:23:42Z) - Predicting protein variants with equivariant graph neural networks [0.0]
我々は,同変グラフニューラルネットワーク(EGNN)と配列に基づくアプローチによる有望なアミノ酸変異の同定能力の比較を行った。
提案する構造的アプローチは, より少ない分子で訓練しながら, 配列に基づくアプローチと競合する性能を実現する。
論文 参考訳(メタデータ) (2023-06-21T12:44:52Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Protein structure generation via folding diffusion [16.12124223972183]
本稿では,タンパク質のバックボーン構造を設計する拡散モデルを提案する。
ランダムな展開状態から安定な折り畳み構造へデノイングすることで、新しい構造を生成する。
有用な資源として、タンパク質構造拡散のための最初のオープンソースおよび訓練されたモデルをリリースする。
論文 参考訳(メタデータ) (2022-09-30T17:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。