論文の概要: EvolMPNN: Predicting Mutational Effect on Homologous Proteins by
Evolution Encoding
- arxiv url: http://arxiv.org/abs/2402.13418v1
- Date: Tue, 20 Feb 2024 23:06:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 17:43:40.299925
- Title: EvolMPNN: Predicting Mutational Effect on Homologous Proteins by
Evolution Encoding
- Title(参考訳): EvolMPNN:進化的エンコーディングによるホモログタンパク質の変異効果予測
- Authors: Zhiqiang Zhong and Davide Mottin
- Abstract要約: 本稿では進化を意識したメッセージパッシングニューラルネットワークであるEvolMPNNを提案し,進化を意識したタンパク質の埋め込みを学習する。
我々のモデルは最先端の手法よりも最大6.4%良い結果を示し、大きな事前学習モデルと比較して36倍の高速化が得られる。
- 参考スコア(独自算出の注目度): 8.348896353632165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting protein properties is paramount for biological and medical
advancements. Current protein engineering mutates on a typical protein, called
the wild-type, to construct a family of homologous proteins and study their
properties. Yet, existing methods easily neglect subtle mutations, failing to
capture the effect on the protein properties. To this end, we propose EvolMPNN,
Evolution-aware Message Passing Neural Network, to learn evolution-aware
protein embeddings. EvolMPNN samples sets of anchor proteins, computes
evolutionary information by means of residues and employs a differentiable
evolution-aware aggregation scheme over these sampled anchors. This way
EvolMPNNcan capture the mutation effect on proteins with respect to the anchor
proteins. Afterwards, the aggregated evolution-aware embeddings are integrated
with sequence embeddings to generate final comprehensive protein embeddings.
Our model shows up to 6.4% better than state-of-the-art methods and attains 36x
inference speedup in comparison with large pre-trained models.
- Abstract(参考訳): タンパク質の性質を予測することは、生物学的および医学的な進歩にとって最重要である。
現在のタンパク質工学は、野生型と呼ばれる典型的なタンパク質に変異を与え、ホモログタンパク質のファミリーを構築し、その性質を研究する。
しかし、既存の方法は微妙な突然変異を軽視しやすく、タンパク質の性質への影響を捉えられなかった。
この目的のために,進化型メッセージパッシングニューラルネットワークであるEvolMPNNを提案し,進化型タンパク質の埋め込みを学習する。
EvolMPNNはアンカータンパク質の集合をサンプリングし、残基を用いて進化情報を計算し、これらのアンカーに対して異なる進化を意識したアグリゲーションスキームを用いる。
この方法で、EvolMPNNはアンカータンパク質に対する変異効果を捉えることができる。
その後、進化認識組込みはシーケンス組込みと統合され、最終的な包括的タンパク質組込みを生成する。
我々のモデルは最先端の手法よりも最大6.4%良い結果を示し、大きな事前学習モデルと比較して36倍の高速化が得られる。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Boosting Protein Language Models with Negative Sample Mining [20.721167029530168]
本稿では,タンパク質表現学習分野における大規模言語モデル向上のための先駆的手法を提案する。
私たちの主な貢献は、共進化の知識への過度な信頼を関連付けるための洗練プロセスにあります。
本手法は,この新たなアプローチを活かして,注目スコア空間内でのトランスフォーマーベースモデルのトレーニングを支援する。
論文 参考訳(メタデータ) (2024-05-28T07:24:20Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Retrieved Sequence Augmentation for Protein Representation Learning [40.13920287967866]
本稿では,タンパク質表現学習のための検索シーケンス拡張について,アライメントや前処理を伴わずに導入する。
本モデルでは,新しいタンパク質ドメインに移行し,デノボタンパク質の予測においてMSAトランスフォーマーより優れていることを示す。
我々の研究はタンパク質の予測における大きなギャップを埋め、タンパク質配列を理解するのに必要なドメイン知識の解読に一歩近づいた。
論文 参考訳(メタデータ) (2023-02-24T10:31:45Z) - SESNet: sequence-structure feature-integrated deep learning method for
data-efficient protein engineering [6.216757583450049]
タンパク質変異体の適合度を予測するための教師付きディープラーニングモデルであるSESNetを開発した。
SESNetは,シーケンスと関数の関係を予測するための最先端モデルよりも優れていることを示す。
我々のモデルは、タンパク質変異体の適合性の予測において、特に高次変異体に対して驚くほど高い精度を達成することができる。
論文 参考訳(メタデータ) (2022-12-29T01:49:52Z) - Plug & Play Directed Evolution of Proteins with Gradient-based Discrete
MCMC [1.0499611180329804]
機械学習ベースのタンパク質工学の長年の目標は、新しい突然変異の発見を加速することである。
本稿では,シリコにおけるタンパク質の進化のためのサンプリングフレームワークについて紹介する。
これらのモデルを構成することで、未知の突然変異を評価し、機能的タンパク質を含む可能性のある配列空間の領域を探索する能力を向上させることを目指している。
論文 参考訳(メタデータ) (2022-12-20T00:26:23Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Using Genetic Programming to Predict and Optimize Protein Function [65.25258357832584]
我々は,進化的手法に基づく遺伝的プログラミングツールPOETを提案し,方向性進化におけるスクリーニングと変異原性を高める。
概念実証として, 化学交換飽和移動機構によって検出されたMRIコントラストを生成するペプチドを用いる。
以上の結果から,POETのような計算モデリングツールは,従来よりも400%優れた機能性を持つペプチドを見つけるのに有効であることが示唆された。
論文 参考訳(メタデータ) (2022-02-08T18:08:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。