論文の概要: CREMP: Conformer-rotamer ensembles of macrocyclic peptides for machine learning
- arxiv url: http://arxiv.org/abs/2305.08057v2
- Date: Fri, 9 Aug 2024 17:16:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-12 21:11:46.074966
- Title: CREMP: Conformer-rotamer ensembles of macrocyclic peptides for machine learning
- Title(参考訳): CREMP: 機械学習のための多環ペプチドコンフォーマーアンサンブル
- Authors: Colin A. Grambow, Hayley Weir, Christian N. Cunningham, Tommaso Biancalani, Kangway V. Chuang,
- Abstract要約: 本稿では,マクロ環状ペプチドを用いた機械学習モデルの迅速開発と評価のためのリソースであるCREMPを紹介する。
CREMPは36,198個のマクロ環状ペプチドとコンフォーマー-ロタマーアンサンブルサンプリングツール(CREST)を用いた高品質な構造アンサンブルを含む
さらに、この新しいデータセットには3130万近いユニークなマクロサイクルのジオメトリが含まれており、それぞれが半経験的拡張タイトバインディング(xTB)DFT計算から導かれるエネルギーでアノテートされている。
- 参考スコア(独自算出の注目度): 0.1747623282473278
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational and machine learning approaches to model the conformational landscape of macrocyclic peptides have the potential to enable rational design and optimization. However, accurate, fast, and scalable methods for modeling macrocycle geometries remain elusive. Recent deep learning approaches have significantly accelerated protein structure prediction and the generation of small-molecule conformational ensembles, yet similar progress has not been made for macrocyclic peptides due to their unique properties. Here, we introduce CREMP, a resource generated for the rapid development and evaluation of machine learning models for macrocyclic peptides. CREMP contains 36,198 unique macrocyclic peptides and their high-quality structural ensembles generated using the Conformer-Rotamer Ensemble Sampling Tool (CREST). Altogether, this new dataset contains nearly 31.3 million unique macrocycle geometries, each annotated with energies derived from semi-empirical extended tight-binding (xTB) DFT calculations. Additionally, we include 3,258 macrocycles with reported passive permeability data to couple conformational ensembles to experiment. We anticipate that this dataset will enable the development of machine learning models that can improve peptide design and optimization for novel therapeutics.
- Abstract(参考訳): 大環状ペプチドのコンフォメーションランドスケープをモデル化するための計算および機械学習アプローチは、合理的な設計と最適化を可能にする可能性がある。
しかし、マクロサイクル測地をモデル化するための正確で高速でスケーラブルな手法は、いまだ解明されていない。
近年の深層学習アプローチはタンパク質の構造予測と小分子コンフォメーションアンサンブルの生成を著しく加速させてきたが、その特異性からマクロ環状ペプチドについては類似の進歩はなされていない。
本稿では,マクロ環状ペプチドの機械学習モデルの開発と評価のための資源であるCREMPを紹介する。
CREMPは36,198個のマクロ環状ペプチドと、Conformer-Rotamer Ensemble Sampling Tool (CREST)を用いて生成された高品質な構造アンサンブルを含む。
さらに、この新しいデータセットには3130万近いユニークなマクロサイクルのジオメトリが含まれており、それぞれが半経験的拡張タイトバインディング(xTB)DFT計算から導かれるエネルギーでアノテートされている。
さらに,2つのコンフォメーションアンサンブルを実験するために,受動透過性データを報告した3,258個のマクロサイクルを含む。
このデータセットは、新しい治療のためのペプチド設計と最適化を改善する機械学習モデルの開発を可能にすることを期待する。
関連論文リスト
- Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Accurate and Efficient Structural Ensemble Generation of Macrocyclic Peptides using Internal Coordinate Diffusion [0.5475672579692472]
RINGERは拡散型トランスフォーマーモデルであり、その2次元表現から大環状ペプチドの3次元コンフォメーションアンサンブルを生成する。
本稿では,RINGERが計算コストのごく一部で高品質かつ多様なジオメトリを生成する方法を示す。
論文 参考訳(メタデータ) (2023-05-30T16:39:18Z) - AlphaFold Distillation for Protein Design [25.190210443632825]
逆タンパク質の折りたたみはバイオエンジニアリングと薬物発見に不可欠である。
AlphaFoldのような前方の折りたたみモデルは、シーケンスから構造を正確に予測することで潜在的な解決策を提供する。
本稿では, 折り畳みモデルの信頼性測定値に対する知識蒸留を用いて, より高速かつエンドツーエンドの識別可能な蒸留モデルを作成することを提案する。
論文 参考訳(メタデータ) (2022-10-05T19:43:06Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Atomic structure generation from reconstructing structural fingerprints [1.2128971613239876]
本稿では、原子中心対称性関数を表現として、条件付き変分オートエンコーダを生成モデルとして、エンドツーエンド構造生成手法を提案する。
我々は、概念実証として、サブナノメーターPtナノ粒子の新規で有効な原子構造を生成することに成功した。
論文 参考訳(メタデータ) (2022-07-27T00:42:59Z) - Linking Properties to Microstructure in Liquid Metal Embedded Elastomers
via Machine Learning [0.0]
液体金属(LM)はエラストマーマトリックスに埋め込まれ、独特の熱、誘電体、機械的特性を持つ軟質複合材料が得られる。
これらの材料の性質と構造を結びつけることにより、材料設計を合理的に行うことができる。
論文 参考訳(メタデータ) (2022-07-24T06:02:26Z) - Three-dimensional microstructure generation using generative adversarial
neural networks in the context of continuum micromechanics [77.34726150561087]
本研究は, 三次元マイクロ構造生成に適した生成対向ネットワークを提案する。
軽量アルゴリズムは、明示的な記述子を必要とせずに、単一のmicroCTスキャンから材料の基礎特性を学習することができる。
論文 参考訳(メタデータ) (2022-05-31T13:26:51Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。