論文の概要: TERMinator: A Neural Framework for Structure-Based Protein Design using
Tertiary Repeating Motifs
- arxiv url: http://arxiv.org/abs/2204.13048v1
- Date: Wed, 27 Apr 2022 16:42:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-28 16:20:24.780537
- Title: TERMinator: A Neural Framework for Structure-Based Protein Design using
Tertiary Repeating Motifs
- Title(参考訳): TERMinator:第三次反復モチーフを用いた構造ベースタンパク質設計のためのニューラルネットワークフレームワーク
- Authors: Alex J. Li, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating
- Abstract要約: バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示す。
第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みも,タンパク質設計タスクにおいて優れた性能を示した。
我々のグラフベースのアーキテクチャであるTERMinatorは、TERMベースの座標ベースの情報を組み込んで、シーケンス空間上でPottsモデルを出力する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational protein design has the potential to deliver novel molecular
structures, binders, and catalysts for myriad applications. Recent neural
graph-based models that use backbone coordinate-derived features show
exceptional performance on native sequence recovery tasks and are promising
frameworks for design. A statistical framework for modeling protein sequence
landscapes using Tertiary Motifs (TERMs), compact units of recurring structure
in proteins, has also demonstrated good performance on protein design tasks. In
this work, we investigate the use of TERM-derived data as features in neural
protein design frameworks. Our graph-based architecture, TERMinator,
incorporates TERM-based and coordinate-based information and outputs a Potts
model over sequence space. TERMinator outperforms state-of-the-art models on
native sequence recovery tasks, suggesting that utilizing TERM-based and
coordinate-based features together is beneficial for protein design.
- Abstract(参考訳): 計算タンパク質の設計は、新しい分子構造、バインダー、触媒を無数の用途にもたらす可能性がある。
バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示し、設計に有望なフレームワークである。
第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みは、タンパク質の繰り返し構造のコンパクトな単位であり、タンパク質設計タスクにおいて優れた性能を示した。
本研究では, TERM由来のデータを用いた神経タンパク質設計フレームワークの特徴について検討する。
我々のグラフベースアーキテクチャであるTERMinatorは、TERMベースおよび座標ベース情報を組み込んで、シーケンス空間上でPottsモデルを出力する。
TERMinatorは、ネイティブシークエンスリカバリタスクの最先端モデルよりも優れており、TERMベースの機能と座標ベースの機能を併用することは、タンパク質設計に有用である。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Multi-Scale Representation Learning for Protein Fitness Prediction [31.735234482320283]
これまでの手法は主に、巨大でラベルなしのタンパク質配列や構造データセットに基づいて訓練された自己教師型モデルに依存してきた。
本稿では,タンパク質の機能を統合する新しいマルチモーダル表現学習フレームワークであるSequence-Structure-Surface Fitness (S3F)モデルを紹介する。
提案手法は,タンパク質言語モデルからの配列表現と,タンパク質のバックボーンと詳細な表面トポロジーをコードするGeometric Vector Perceptronネットワークを組み合わせる。
論文 参考訳(メタデータ) (2024-12-02T04:28:10Z) - SeqProFT: Applying LoRA Finetuning for Sequence-only Protein Property Predictions [8.112057136324431]
本研究では,ESM-2モデルのエンド・ツー・エンドの微調整を行うためにLoRA法を用いる。
下流ネットワークにマルチヘッドアテンション機構を統合して、シーケンス特徴とコンタクトマップ情報を組み合わせる。
論文 参考訳(メタデータ) (2024-11-18T12:40:39Z) - Generating Highly Designable Proteins with Geometric Algebra Flow Matching [1.1874952582465603]
幾何生成物と高次メッセージパッシングを利用したタンパク質のバックボーン設計のための生成モデルを提案する。
我々は、タンパク質のバックボーン生成のための最先端フローマッチングモデルであるFrameFlowのフレームワークにそれを組み込むことで、アーキテクチャを評価する。
論文 参考訳(メタデータ) (2024-11-07T23:21:36Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Cliqueformer: Model-Based Optimization with Structured Transformers [102.55764949282906]
大規模なニューラルネットワークは予測タスクに優れるが、タンパク質工学や材料発見といった設計問題への応用には、オフラインモデルベース最適化(MBO)の問題を解決する必要がある。
機能的グラフィカルモデル(FGM)を用いてブラックボックス関数の構造を学習するトランスフォーマーベースのアーキテクチャであるCliqueformerを提案する。
化学および遺伝子設計タスクを含む様々な領域において、Cliqueformerは既存の方法よりも優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-17T00:35:47Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - A Systematic Study of Joint Representation Learning on Protein Sequences
and Structures [38.94729758958265]
効果的なタンパク質表現の学習は、タンパク質機能の予測のような生物学の様々なタスクにおいて重要である。
近年, タンパク質言語モデル(PLM)に基づく配列表現学習法は, 配列ベースタスクでは優れているが, タンパク質構造に関わるタスクへの直接適応は依然として困難である。
本研究は、最先端のPLMと異なる構造エンコーダを統合することで、結合タンパク質表現学習の包括的研究を行う。
論文 参考訳(メタデータ) (2023-03-11T01:24:10Z) - RDesign: Hierarchical Data-efficient Representation Learning for
Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。
我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。
RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文 参考訳(メタデータ) (2023-01-25T17:19:49Z) - Energy-based models for atomic-resolution protein conformations [88.68597850243138]
原子スケールで動作するタンパク質コンホメーションのエネルギーモデル(EBM)を提案する。
このモデルは、結晶化されたタンパク質のデータにのみ訓練されている。
モデル出力と隠された表現の研究により、タンパク質エネルギーに関連する物理化学的性質を捉えることが判明した。
論文 参考訳(メタデータ) (2020-04-27T20:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。