Fugu-MT 論文翻訳(概要): TERMinator: A Neural Framework for Structure-Based Protein Design using Tertiary Repeating Motifs

論文の概要: TERMinator: A Neural Framework for Structure-Based Protein Design using Tertiary Repeating Motifs

arxiv url: http://arxiv.org/abs/2204.13048v1
Date: Wed, 27 Apr 2022 16:42:10 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-28 16:20:24.780537
Title: TERMinator: A Neural Framework for Structure-Based Protein Design using Tertiary Repeating Motifs
Title（参考訳）: TERMinator:第三次反復モチーフを用いた構造ベースタンパク質設計のためのニューラルネットワークフレームワーク
Authors: Alex J. Li, Vikram Sundar, Gevorg Grigoryan, Amy E. Keating
Abstract要約: バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示す。第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みも,タンパク質設計タスクにおいて優れた性能を示した。我々のグラフベースのアーキテクチャであるTERMinatorは、TERMベースの座標ベースの情報を組み込んで、シーケンス空間上でPottsモデルを出力する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Computational protein design has the potential to deliver novel molecular structures, binders, and catalysts for myriad applications. Recent neural graph-based models that use backbone coordinate-derived features show exceptional performance on native sequence recovery tasks and are promising frameworks for design. A statistical framework for modeling protein sequence landscapes using Tertiary Motifs (TERMs), compact units of recurring structure in proteins, has also demonstrated good performance on protein design tasks. In this work, we investigate the use of TERM-derived data as features in neural protein design frameworks. Our graph-based architecture, TERMinator, incorporates TERM-based and coordinate-based information and outputs a Potts model over sequence space. TERMinator outperforms state-of-the-art models on native sequence recovery tasks, suggesting that utilizing TERM-based and coordinate-based features together is beneficial for protein design.
Abstract（参考訳）: 計算タンパク質の設計は、新しい分子構造、バインダー、触媒を無数の用途にもたらす可能性がある。バックボーン座標に基づく最近のニューラルグラフベースモデルは、ネイティブシーケンス回復タスクにおいて例外的なパフォーマンスを示し、設計に有望なフレームワークである。第3次モチーフ(TERM)を用いたタンパク質配列のモデリングのための統計的枠組みは、タンパク質の繰り返し構造のコンパクトな単位であり、タンパク質設計タスクにおいて優れた性能を示した。本研究では, TERM由来のデータを用いた神経タンパク質設計フレームワークの特徴について検討する。我々のグラフベースアーキテクチャであるTERMinatorは、TERMベースおよび座標ベース情報を組み込んで、シーケンス空間上でPottsモデルを出力する。 TERMinatorは、ネイティブシークエンスリカバリタスクの最先端モデルよりも優れており、TERMベースの機能と座標ベースの機能を併用することは、タンパク質設計に有用である。

関連論文リスト

PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [80.08310253195144]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。 PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文参考訳（メタデータ） (2025-07-07T15:21:05Z)
DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。 DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文参考訳（メタデータ） (2025-06-18T23:58:22Z)
A Model-Centric Review of Deep Learning for Protein Design [0.0]
ディープラーニングはタンパク質設計を変換し、正確な構造予測、シーケンス最適化、de novoタンパク質生成を可能にした。 ProtGPT2、ProteinMPNN、RFdiffusionなどの生成モデルは、自然進化に基づく制限を超えてシーケンスとバックボーンの設計を可能にした。最近では、ESM3を含む共同シーケンス構造共設計モデルが両方のモダリティを統一されたフレームワークに統合し、設計性が向上した。
論文参考訳（メタデータ） (2025-02-26T14:31:21Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
Multi-Scale Representation Learning for Protein Fitness Prediction [31.735234482320283]
これまでの手法は主に、巨大でラベルなしのタンパク質配列や構造データセットに基づいて訓練された自己教師型モデルに依存してきた。本稿では,タンパク質の機能を統合する新しいマルチモーダル表現学習フレームワークであるSequence-Structure-Surface Fitness (S3F)モデルを紹介する。提案手法は,タンパク質言語モデルからの配列表現と,タンパク質のバックボーンと詳細な表面トポロジーをコードするGeometric Vector Perceptronネットワークを組み合わせる。
論文参考訳（メタデータ） (2024-12-02T04:28:10Z)
SeqProFT: Applying LoRA Finetuning for Sequence-only Protein Property Predictions [8.112057136324431]
本研究では,ESM-2モデルのエンド・ツー・エンドの微調整を行うためにLoRA法を用いる。下流ネットワークにマルチヘッドアテンション機構を統合して、シーケンス特徴とコンタクトマップ情報を組み合わせる。
論文参考訳（メタデータ） (2024-11-18T12:40:39Z)
Generating Highly Designable Proteins with Geometric Algebra Flow Matching [1.1874952582465603]
幾何生成物と高次メッセージパッシングを利用したタンパク質のバックボーン設計のための生成モデルを提案する。我々は、タンパク質のバックボーン生成のための最先端フローマッチングモデルであるFrameFlowのフレームワークにそれを組み込むことで、アーキテクチャを評価する。
論文参考訳（メタデータ） (2024-11-07T23:21:36Z)
SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文参考訳（メタデータ） (2024-10-31T15:22:03Z)
Cliqueformer: Model-Based Optimization with Structured Transformers [102.55764949282906]
我々は、MBOタスクの構造を学習し、経験的に改良された設計につながるモデルを開発する。我々はCliqueformerを、高次元のブラックボックス機能から、化学・遺伝設計の現実的なタスクまで、様々なタスクで評価する。
論文参考訳（メタデータ） (2024-10-17T00:35:47Z)
Endowing Protein Language Models with Structural Knowledge [5.587293092389789]
本稿では,タンパク質構造データを統合することにより,タンパク質言語モデルを強化する新しいフレームワークを提案する。 PST(Protein Structure Transformer)と呼ばれる精製モデルは、小さなタンパク質構造データベース上でさらに事前訓練されている。 PSTは、タンパク質配列の最先端基盤モデルであるESM-2を一貫して上回り、タンパク質機能予測の新しいベンチマークを設定している。
論文参考訳（メタデータ） (2024-01-26T12:47:54Z)
A Hierarchical Training Paradigm for Antibody Structure-sequence Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。 HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文参考訳（メタデータ） (2023-10-30T02:39:15Z)
Disentangling Structured Components: Towards Adaptive, Interpretable and Scalable Time Series Forecasting [52.47493322446537]
本研究では,時空間パターンの各コンポーネントを個別にモデル化する適応的,解釈可能,スケーラブルな予測フレームワークを開発する。 SCNNは、空間時間パターンの潜在構造を算術的に特徴づける、MSSの事前定義された生成プロセスで動作する。 SCNNが3つの実世界のデータセットの最先端モデルよりも優れた性能を達成できることを示すため、大規模な実験が行われた。
論文参考訳（メタデータ） (2023-05-22T13:39:44Z)
A Systematic Study of Joint Representation Learning on Protein Sequences and Structures [38.94729758958265]
効果的なタンパク質表現の学習は、タンパク質機能の予測のような生物学の様々なタスクにおいて重要である。近年, タンパク質言語モデル(PLM)に基づく配列表現学習法は, 配列ベースタスクでは優れているが, タンパク質構造に関わるタスクへの直接適応は依然として困難である。本研究は、最先端のPLMと異なる構造エンコーダを統合することで、結合タンパク質表現学習の包括的研究を行う。
論文参考訳（メタデータ） (2023-03-11T01:24:10Z)
RDesign: Hierarchical Data-efficient Representation Learning for Tertiary Structure-based RNA Design [65.41144149958208]
本研究では,データ駆動型RNA設計パイプラインを体系的に構築することを目的とする。我々は、ベンチマークデータセットを作成し、複雑なRNA第三次構造を表現するための包括的な構造モデリングアプローチを設計した。 RNA設計プロセスを容易にするために,塩基対を持つ抽出二次構造体を事前知識として組み込んだ。
論文参考訳（メタデータ） (2023-01-25T17:19:49Z)
Energy-based models for atomic-resolution protein conformations [88.68597850243138]
原子スケールで動作するタンパク質コンホメーションのエネルギーモデル(EBM)を提案する。このモデルは、結晶化されたタンパク質のデータにのみ訓練されている。モデル出力と隠された表現の研究により、タンパク質エネルギーに関連する物理化学的性質を捉えることが判明した。
論文参考訳（メタデータ） (2020-04-27T20:45:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。