論文の概要: TERMinator: A Neural Framework for Structure-Based Protein Design using
Tertiary Repeating Motifs
- arxiv url: http://arxiv.org/abs/2204.13048v1
- Date: Wed, 27 Apr 2022 16:42:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 16:20:24.780537
- Title: TERMinator: A Neural Framework for Structure-Based Protein Design using
Tertiary Repeating Motifs
- Title(参考訳): TERMinator:第三次反復モチーフを用いた構造ベースタンパク質設計のためのニューラルネットワークフレームワーク
- Authors: Alex J. Li, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating
- Abstract要約: バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示す。
第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みも,タンパク質設計タスクにおいて優れた性能を示した。
我々のグラフベースのアーキテクチャであるTERMinatorは、TERMベースの座標ベースの情報を組み込んで、シーケンス空間上でPottsモデルを出力する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational protein design has the potential to deliver novel molecular
structures, binders, and catalysts for myriad applications. Recent neural
graph-based models that use backbone coordinate-derived features show
exceptional performance on native sequence recovery tasks and are promising
frameworks for design. A statistical framework for modeling protein sequence
landscapes using Tertiary Motifs (TERMs), compact units of recurring structure
in proteins, has also demonstrated good performance on protein design tasks. In
this work, we investigate the use of TERM-derived data as features in neural
protein design frameworks. Our graph-based architecture, TERMinator,
incorporates TERM-based and coordinate-based information and outputs a Potts
model over sequence space. TERMinator outperforms state-of-the-art models on
native sequence recovery tasks, suggesting that utilizing TERM-based and
coordinate-based features together is beneficial for protein design.
- Abstract(参考訳): 計算タンパク質の設計は、新しい分子構造、バインダー、触媒を無数の用途にもたらす可能性がある。
バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示し、設計に有望なフレームワークである。
第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みは、タンパク質の繰り返し構造のコンパクトな単位であり、タンパク質設計タスクにおいて優れた性能を示した。
本研究では, TERM由来のデータを用いた神経タンパク質設計フレームワークの特徴について検討する。
我々のグラフベースアーキテクチャであるTERMinatorは、TERMベースおよび座標ベース情報を組み込んで、シーケンス空間上でPottsモデルを出力する。
TERMinatorは、ネイティブシークエンスリカバリタスクの最先端モデルよりも優れており、TERMベースの機能と座標ベースの機能を併用することは、タンパク質設計に有用である。
関連論文リスト
- SeqProFT: Applying LoRA Finetuning for Sequence-only Protein Property Predictions [8.112057136324431]
本研究では,ESM-2モデルのエンド・ツー・エンドの微調整を行うためにLoRA法を用いる。
下流ネットワークにマルチヘッドアテンション機構を統合して、シーケンス特徴とコンタクトマップ情報を組み合わせる。
論文 参考訳(メタデータ) (2024-11-18T12:40:39Z) - Generating Highly Designable Proteins with Geometric Algebra Flow Matching [1.1874952582465603]
幾何生成物と高次メッセージパッシングを利用したタンパク質のバックボーン設計のための生成モデルを提案する。
我々は、タンパク質のバックボーン生成のための最先端フローマッチングモデルであるFrameFlowのフレームワークにそれを組み込むことで、アーキテクチャを評価する。
論文 参考訳(メタデータ) (2024-11-07T23:21:36Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Cliqueformer: Model-Based Optimization with Structured Transformers [102.55764949282906]
我々は、MBOタスクの構造を学習し、経験的に改良された設計につながるモデルを開発する。
我々はCliqueformerを、高次元のブラックボックス機能から、化学・遺伝設計の現実的なタスクまで、様々なタスクで評価する。
論文 参考訳(メタデータ) (2024-10-17T00:35:47Z) - Endowing Protein Language Models with Structural Knowledge [5.587293092389789]
本稿では,タンパク質構造データを統合することにより,タンパク質言語モデルを強化する新しいフレームワークを提案する。
PST(Protein Structure Transformer)と呼ばれる精製モデルは、小さなタンパク質構造データベース上でさらに事前訓練されている。
PSTは、タンパク質配列の最先端基盤モデルであるESM-2を一貫して上回り、タンパク質機能予測の新しいベンチマークを設定している。
論文 参考訳(メタデータ) (2024-01-26T12:47:54Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - Disentangling Structured Components: Towards Adaptive, Interpretable and
Scalable Time Series Forecasting [52.47493322446537]
本研究では,時空間パターンの各コンポーネントを個別にモデル化する適応的,解釈可能,スケーラブルな予測フレームワークを開発する。
SCNNは、空間時間パターンの潜在構造を算術的に特徴づける、MSSの事前定義された生成プロセスで動作する。
SCNNが3つの実世界のデータセットの最先端モデルよりも優れた性能を達成できることを示すため、大規模な実験が行われた。
論文 参考訳(メタデータ) (2023-05-22T13:39:44Z) - A Systematic Study of Joint Representation Learning on Protein Sequences
and Structures [38.94729758958265]
効果的なタンパク質表現の学習は、タンパク質機能の予測のような生物学の様々なタスクにおいて重要である。
近年, タンパク質言語モデル(PLM)に基づく配列表現学習法は, 配列ベースタスクでは優れているが, タンパク質構造に関わるタスクへの直接適応は依然として困難である。
本研究は、最先端のPLMと異なる構造エンコーダを統合することで、結合タンパク質表現学習の包括的研究を行う。
論文 参考訳(メタデータ) (2023-03-11T01:24:10Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Energy-based models for atomic-resolution protein conformations [88.68597850243138]
原子スケールで動作するタンパク質コンホメーションのエネルギーモデル(EBM)を提案する。
このモデルは、結晶化されたタンパク質のデータにのみ訓練されている。
モデル出力と隠された表現の研究により、タンパク質エネルギーに関連する物理化学的性質を捉えることが判明した。
論文 参考訳(メタデータ) (2020-04-27T20:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。