論文の概要: Generative modeling, design and analysis of spider silk protein
sequences for enhanced mechanical properties
- arxiv url: http://arxiv.org/abs/2309.10170v1
- Date: Mon, 18 Sep 2023 21:38:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 07:07:20.353279
- Title: Generative modeling, design and analysis of spider silk protein
sequences for enhanced mechanical properties
- Title(参考訳): スパイダーシルクタンパク質配列の創製、設計および解析による機械的特性の向上
- Authors: Wei Lu, David L. Kaplan, Markus J. Buehler
- Abstract要約: そこで本研究では,新しいクモの糸状タンパク質配列を設計するための多言語モデルを提案する。
このモデルは、関連する繊維レベルの力学的性質が存在する1000個の主要なアンパルススパイドリン (MaSp) 配列に微調整される。
- 参考スコア(独自算出の注目度): 4.933851214936362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spider silks are remarkable materials characterized by superb mechanical
properties such as strength, extensibility and lightweightedness. Yet, to date,
limited models are available to fully explore sequence-property relationships
for analysis and design. Here we propose a custom generative large-language
model to enable design of novel spider silk protein sequences to meet complex
combinations of target mechanical properties. The model, pretrained on a large
set of protein sequences, is fine-tuned on ~1,000 major ampullate spidroin
(MaSp) sequences for which associated fiber-level mechanical properties exist,
to yield an end-to-end forward and inverse generative strategy. Performance is
assessed through: (1), a novelty analysis and protein type classification for
generated spidroin sequences through BLAST searches, (2) property evaluation
and comparison with similar sequences, (3) comparison of molecular structures,
as well as, and (4) a detailed sequence motif analyses. We generate silk
sequences with property combinations that do not exist in nature, and develop a
deep understanding the mechanistic roles of sequence patterns in achieving
overarching key mechanical properties (elastic modulus, strength, toughness,
failure strain). The model provides an efficient approach to expand the silkome
dataset, facilitating further sequence-structure analyses of silks, and
establishes a foundation for synthetic silk design and optimization.
- Abstract(参考訳): クモ糸は強度、伸縮性、軽量性といった優れた機械的特性を特徴とする優れた材料である。
しかし、これまでは、解析と設計のためのシーケンス-プロパティ関係を完全に探求する限定モデルが利用可能である。
本稿では,新規なスパイダーシルクタンパク質配列の設計を目標の機械的特性の複雑な組み合わせに適合させるカスタム生成型大言語モデルを提案する。
多数のタンパク質配列に基づいて事前訓練されたこのモデルは、繊維レベルの機械的特性が関連する1,000以上の主要両親媒性スピロリン(masp)配列に基づいて微調整され、エンドツーエンドの前方および逆生成戦略が得られる。
1) 発破探索による生成スピドロリン配列の新規解析とタンパク質型分類, (2) 特性評価と類似配列との比較, (3) 分子構造の比較, そして(4) 詳細な配列モチーフ解析を行った。
自然界に存在しない性質の組み合わせを持つ絹の配列を生成し,重要な機械的特性(弾性率,強度,靭性,破壊ひずみ)を克服する上でのシーケンスパターンの力学的役割を深く理解する。
このモデルは、シルコメデータセットを拡張するための効率的なアプローチを提供し、シルクのさらなるシーケンス構造分析を促進し、合成シルクの設計と最適化の基礎を確立する。
関連論文リスト
- Equivariant graph convolutional neural networks for the representation of homogenized anisotropic microstructural mechanical response [1.283555556182245]
異なるミクロ構造材料対称性を持つ複合材料は、工学的応用において一般的である。
異方性成分を持つ材料の効果的な均質化モデルを提供するニューラルネットワークアーキテクチャを提供する。
論文 参考訳(メタデータ) (2024-04-05T14:49:01Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Target-aware Variational Auto-encoders for Ligand Generation with
Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。
これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文 参考訳(メタデータ) (2023-08-02T12:08:17Z) - Fast and Functional Structured Data Generators Rooted in
Out-of-Equilibrium Physics [62.997667081978825]
エネルギーモデルを用いて、構造化データセットで高品質なラベル特化データを生成するという課題に対処する。
伝統的な訓練方法は、マルコフ連鎖モンテカルロ混合による困難に遭遇する。
非平衡効果を利用した新しいトレーニングアルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-07-13T15:08:44Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Fold2Seq: A Joint Sequence(1D)-Fold(3D) Embedding-based Generative Model
for Protein Design [70.27706384570723]
Fold2Seqは特定の標的に条件付きタンパク質配列を設計するための新しいフレームワークである。
Fold2Seqの性能は, シーケンス設計の速度, カバレッジ, 信頼性において向上したか, 同等であったかを示す。
フォールドベースのFold2Seqの独特な利点は、構造ベースのディープモデルやRosettaDesignと比較して、3つの現実世界の課題においてより明確になる。
論文 参考訳(メタデータ) (2021-06-24T14:34:24Z) - Generating Tertiary Protein Structures via an Interpretative Variational
Autoencoder [16.554053012204182]
本稿では,タンパク質の機能的関連3次元構造を生成するための代替手法を提案し,評価する。
いくつかの深層建築の包括的評価は、新しい第三次構造をサンプリングするための潜伏空間を直接明らかにする上で、生成モデルの可能性を示唆している。
論文 参考訳(メタデータ) (2020-04-08T17:40:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。