論文の概要: Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical
Coarse-graining SO(3)-Equivariant Autoencoders
- arxiv url: http://arxiv.org/abs/2310.02508v1
- Date: Wed, 4 Oct 2023 01:01:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 17:01:39.640890
- Title: Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical
Coarse-graining SO(3)-Equivariant Autoencoders
- Title(参考訳): Ophiuchus: 階層的粗粒化SO(3)-等価オートエンコーダによるタンパク質構造のスケーラブルモデリング
- Authors: Allan dos Santos Costa and Ilan Mitnikov and Mario Geiger and Manvitha
Ponnapati and Tess Smidt and Joseph Jacobson
- Abstract要約: 天然タンパク質の3次元自然状態と階層的パターン
従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。
オフィチュス(Ophiuchus)は、標準タンパク質残基の重原子全てに効率よく作用するSO(3)同変粗粒化モデルである。
- 参考スコア(独自算出の注目度): 1.8835495377767553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Three-dimensional native states of natural proteins display recurring and
hierarchical patterns. Yet, traditional graph-based modeling of protein
structures is often limited to operate within a single fine-grained resolution,
and lacks hourglass neural architectures to learn those high-level building
blocks. We narrow this gap by introducing Ophiuchus, an SO(3)-equivariant
coarse-graining model that efficiently operates on all heavy atoms of standard
protein residues, while respecting their relevant symmetries. Our model departs
from current approaches that employ graph modeling, instead focusing on local
convolutional coarsening to model sequence-motif interactions in log-linear
length complexity. We train Ophiuchus on contiguous fragments of PDB monomers,
investigating its reconstruction capabilities across different compression
rates. We examine the learned latent space and demonstrate its prompt usage in
conformational interpolation, comparing interpolated trajectories to structure
snapshots from the PDBFlex dataset. Finally, we leverage denoising diffusion
probabilistic models (DDPM) to efficiently sample readily-decodable latent
embeddings of diverse miniproteins. Our experiments demonstrate Ophiuchus to be
a scalable basis for efficient protein modeling and generation.
- Abstract(参考訳): 自然タンパク質の3次元ネイティブ状態は反復的および階層的パターンを示す。
しかし、従来のグラフベースのタンパク質構造のモデリングは、しばしば単一のきめ細かい解像度で操作することに限られ、それらのハイレベルな構成要素を学ぶのに砂時計の神経アーキテクチャが欠如している。
標準タンパク質残基のすべての重原子上で効率的に作用するso(3)同変粗粒モデルであるophiuchusを導入することで,このギャップを狭める。
我々のモデルは、グラフモデリングを用いた現在のアプローチから外れ、代わりに局所畳み込み粗さに着目して、ログ線形長複雑性におけるシーケンス-モチフ相互作用をモデル化する。
我々はPDBモノマーの連続フラグメント上でOphiuchusを訓練し、その再構成能力を異なる圧縮速度で調べる。
PDBFlexデータセットからの補間トラジェクトリと構造スナップショットを比較し,学習した潜伏空間を検証し,コンフォメーション補間における迅速な利用法を示す。
最後に, 分散確率モデル(DDPM)を用いて, 様々なミニタンパク質の容易に分解可能な潜伏埋め込みを効率的にサンプリングする。
我々の実験は、Ophiuchusが効率的なタンパク質モデリングと生成のためのスケーラブルな基盤であることを実証した。
関連論文リスト
- Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-10-17T15:10:13Z) - Accelerating Inference in Molecular Diffusion Models with Latent Representations of Protein Structure [0.0]
拡散生成モデルは3次元分子構造に直接作用する。
分子構造の潜在表現を学習するための新しいGNNアーキテクチャを提案する。
本モデルでは,全原子タンパク質の表現に匹敵する性能を示しながら,推論時間を3倍に短縮した。
論文 参考訳(メタデータ) (2023-11-22T15:32:31Z) - Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。
これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文 参考訳(メタデータ) (2023-07-11T16:51:38Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - EigenFold: Generative Protein Structure Prediction with Diffusion Models [10.24107243529341]
EigenFoldは、特定のタンパク質配列から構造分布をサンプリングする拡散生成モデリングフレームワークである。
最近のCAMEOターゲットでは、EigenFoldは0.84の中央値TMSスコアを達成し、モデルの不確実性のより包括的な画像を提供する。
論文 参考訳(メタデータ) (2023-04-05T02:46:13Z) - Internal-Coordinate Density Modelling of Protein Structure: Covariance
Matters [9.49959422062959]
内部座標におけるタンパク質密度をモデル化するための新しい戦略を提案し, 内部自由度間の共分散構造を誘導するために3次元空間における制約を用いる。
提案手法により,内部座標の密度モデルを2つの設定で完全なタンパク質のバックボーンに拡張できることが実証された。
論文 参考訳(メタデータ) (2023-02-27T12:18:19Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - G-VAE, a Geometric Convolutional VAE for ProteinStructure Generation [41.66010308405784]
本稿では,3次元タンパク質構造の比較,変形,生成のための統合幾何学的ニューラルネットワーク手法を提案する。
本手法は, トレーニングデータの構造と異なり, 可塑性構造を生成することができる。
論文 参考訳(メタデータ) (2021-06-22T16:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。