論文の概要: TERMinator: A Neural Framework for Structure-Based Protein Design using
Tertiary Repeating Motifs
- arxiv url: http://arxiv.org/abs/2204.13048v1
- Date: Wed, 27 Apr 2022 16:42:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 16:20:24.780537
- Title: TERMinator: A Neural Framework for Structure-Based Protein Design using
Tertiary Repeating Motifs
- Title(参考訳): TERMinator:第三次反復モチーフを用いた構造ベースタンパク質設計のためのニューラルネットワークフレームワーク
- Authors: Alex J. Li, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating
- Abstract要約: バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示す。
第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みも,タンパク質設計タスクにおいて優れた性能を示した。
我々のグラフベースのアーキテクチャであるTERMinatorは、TERMベースの座標ベースの情報を組み込んで、シーケンス空間上でPottsモデルを出力する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational protein design has the potential to deliver novel molecular
structures, binders, and catalysts for myriad applications. Recent neural
graph-based models that use backbone coordinate-derived features show
exceptional performance on native sequence recovery tasks and are promising
frameworks for design. A statistical framework for modeling protein sequence
landscapes using Tertiary Motifs (TERMs), compact units of recurring structure
in proteins, has also demonstrated good performance on protein design tasks. In
this work, we investigate the use of TERM-derived data as features in neural
protein design frameworks. Our graph-based architecture, TERMinator,
incorporates TERM-based and coordinate-based information and outputs a Potts
model over sequence space. TERMinator outperforms state-of-the-art models on
native sequence recovery tasks, suggesting that utilizing TERM-based and
coordinate-based features together is beneficial for protein design.
- Abstract(参考訳): 計算タンパク質の設計は、新しい分子構造、バインダー、触媒を無数の用途にもたらす可能性がある。
バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示し、設計に有望なフレームワークである。
第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みは、タンパク質の繰り返し構造のコンパクトな単位であり、タンパク質設計タスクにおいて優れた性能を示した。
本研究では, TERM由来のデータを用いた神経タンパク質設計フレームワークの特徴について検討する。
我々のグラフベースアーキテクチャであるTERMinatorは、TERMベースおよび座標ベース情報を組み込んで、シーケンス空間上でPottsモデルを出力する。
TERMinatorは、ネイティブシークエンスリカバリタスクの最先端モデルよりも優れており、TERMベースの機能と座標ベースの機能を併用することは、タンパク質設計に有用である。
関連論文リスト
- Endowing Protein Language Models with Structural Knowledge [5.587293092389789]
本稿では,タンパク質構造データを統合することにより,タンパク質言語モデルを強化する新しいフレームワークを提案する。
PST(Protein Structure Transformer)と呼ばれる精製モデルは、小さなタンパク質構造データベース上でさらに事前訓練されている。
PSTは、タンパク質配列の最先端基盤モデルであるESM-2を一貫して上回り、タンパク質機能予測の新しいベンチマークを設定している。
論文 参考訳(メタデータ) (2024-01-26T12:47:54Z) - MMDesign: Multi-Modality Transfer Learning for Generative Protein Design [66.49989188722553]
タンパク質の設計は、対応するタンパク質のバックボーンに基づいてタンパク質配列を生成する。
深層生成モデルは、データから直接タンパク質設計を学ぶことを約束している。
パブリックな構造系列ペアリングの欠如は、一般化能力を制限している。
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical
Coarse-graining SO(3)-Equivariant Autoencoders [1.8835495377767553]
天然タンパク質の3次元ネイティブ状態は、繰り返しおよび階層的なパターンを示す。
従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。
オフィチュス(Ophiuchus)は、全原子タンパク質構造を効率的に操作するSO(3)等価な粗粒化モデルである。
論文 参考訳(メタデータ) (2023-10-04T01:01:11Z) - Neural Embeddings for Protein Graphs [0.8258451067861933]
幾何学ベクトル空間にタンパク質グラフを埋め込む新しい枠組みを提案する。
タンパク質グラフ間の構造的距離を保存するエンコーダ関数を学習する。
本フレームワークは,タンパク質構造分類の課題において,顕著な結果をもたらす。
論文 参考訳(メタデータ) (2023-06-07T14:50:34Z) - Disentangling Structured Components: Towards Adaptive, Interpretable and
Scalable Time Series Forecasting [52.47493322446537]
本研究では,時空間パターンの各コンポーネントを個別にモデル化する適応的,解釈可能,スケーラブルな予測フレームワークを開発する。
SCNNは、空間時間パターンの潜在構造を算術的に特徴づける、MSSの事前定義された生成プロセスで動作する。
SCNNが3つの実世界のデータセットの最先端モデルよりも優れた性能を達成できることを示すため、大規模な実験が行われた。
論文 参考訳(メタデータ) (2023-05-22T13:39:44Z) - A Systematic Study of Joint Representation Learning on Protein Sequences
and Structures [38.94729758958265]
効果的なタンパク質表現の学習は、タンパク質機能の予測のような生物学の様々なタスクにおいて重要である。
近年, タンパク質言語モデル(PLM)に基づく配列表現学習法は, 配列ベースタスクでは優れているが, タンパク質構造に関わるタスクへの直接適応は依然として困難である。
本研究は、最先端のPLMと異なる構造エンコーダを統合することで、結合タンパク質表現学習の包括的研究を行う。
論文 参考訳(メタデータ) (2023-03-11T01:24:10Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - Energy-based models for atomic-resolution protein conformations [88.68597850243138]
原子スケールで動作するタンパク質コンホメーションのエネルギーモデル(EBM)を提案する。
このモデルは、結晶化されたタンパク質のデータにのみ訓練されている。
モデル出力と隠された表現の研究により、タンパク質エネルギーに関連する物理化学的性質を捉えることが判明した。
論文 参考訳(メタデータ) (2020-04-27T20:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。