論文の概要: DiAMoNDBack: Diffusion-denoising Autoregressive Model for
Non-Deterministic Backmapping of C{\alpha} Protein Traces
- arxiv url: http://arxiv.org/abs/2307.12451v1
- Date: Sun, 23 Jul 2023 23:05:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-25 16:00:49.278392
- Title: DiAMoNDBack: Diffusion-denoising Autoregressive Model for
Non-Deterministic Backmapping of C{\alpha} Protein Traces
- Title(参考訳): DiAMoNDBack: C{\alpha}タンパク質の非決定論的バックマッピングのための拡散還元自己回帰モデル
- Authors: Michael S. Jones and Kirill Shmilovich and Andrew L. Ferguson
- Abstract要約: DiAMoNDBack は非決定論的バックマッピングのための自己回帰デノナイジング拡散確率モデルである。
我々は、タンパク質データバンク(PDB)から65k以上の構造をトレーニングし、それをホールドアウトしたPDBテストセットにアプリケーションで検証する。
DiAMoNDBackは、フリーでオープンソースのPythonパッケージとして公開しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coarse-grained molecular models of proteins permit access to length and time
scales unattainable by all-atom models and the simulation of processes that
occur on long-time scales such as aggregation and folding. The reduced
resolution realizes computational accelerations but an atomistic representation
can be vital for a complete understanding of mechanistic details. Backmapping
is the process of restoring all-atom resolution to coarse-grained molecular
models. In this work, we report DiAMoNDBack (Diffusion-denoising Autoregressive
Model for Non-Deterministic Backmapping) as an autoregressive denoising
diffusion probability model to restore all-atom details to coarse-grained
protein representations retaining only C{\alpha} coordinates. The
autoregressive generation process proceeds from the protein N-terminus to
C-terminus in a residue-by-residue fashion conditioned on the C{\alpha} trace
and previously backmapped backbone and side chain atoms within the local
neighborhood. The local and autoregressive nature of our model makes it
transferable between proteins. The stochastic nature of the denoising diffusion
process means that the model generates a realistic ensemble of backbone and
side chain all-atom configurations consistent with the coarse-grained C{\alpha}
trace. We train DiAMoNDBack over 65k+ structures from Protein Data Bank (PDB)
and validate it in applications to a hold-out PDB test set,
intrinsically-disordered protein structures from the Protein Ensemble Database
(PED), molecular dynamics simulations of fast-folding mini-proteins from DE
Shaw Research, and coarse-grained simulation data. We achieve state-of-the-art
reconstruction performance in terms of correct bond formation, avoidance of
side chain clashes, and diversity of the generated side chain configurational
states. We make DiAMoNDBack model publicly available as a free and open source
Python package.
- Abstract(参考訳): タンパク質の粗い粒度の分子モデルは、全原子モデルでは達成できない長さと時間スケールへのアクセスと、凝集や折り畳みなどの長時間スケールで起こるプロセスのシミュレーションを可能にする。
分解能の低下は計算加速度を実現するが、機械的詳細の完全な理解には原子論的な表現が不可欠である。
バックマッピングは、全原子分解能を粗い分子モデルに復元するプロセスである。
本研究では,DiaMoNDBack(Diffusion-denoising Autoregressive Model for Non-Deterministic Backmapping)を自己回帰分解拡散確率モデルとして報告し,全原子の詳細をC{\alpha}座標のみを保持する粗粒タンパク質表現に復元する。
自己回帰生成過程は、C{\alpha}トレースに条件付き残基バイレジデント方式でタンパク質N末端からC末端へと進行し、以前は局所近傍のバックボーンと側鎖原子がバックマップされていた。
我々のモデルにおける局所的および自己回帰的な性質は、タンパク質間の移動を可能にする。
消音拡散過程の確率的性質は、モデルが粗粒c{\alpha}トレースと整合するバックボーンとサイドチェーンの全原子配置の現実的なアンサンブルを生成することを意味する。
タンパク質データバンク (pdb) から65k以上の構造をダイアモンドバックし, ホールドアウト pdb テストセット, タンパク質アンサンブルデータベース (ped) による内在的不規則タンパク質構造, ド・ショー研究による高速折り畳みミニタンパク質の分子動力学シミュレーション, 粗粒度シミュレーションデータに適用した。
我々は, 正しい結合形成, 側鎖衝突の回避, 生成側鎖構成状態の多様性の観点から, 最先端の再構築性能を実現する。
DiAMoNDBackモデルをフリーでオープンソースのPythonパッケージとして公開しています。
関連論文リスト
- Deep Equilibrium Diffusion Restoration with Parallel Sampling [127.31325974698993]
拡散に基づく画像復元法の多くは、HQイメージを段階的に復元するために長いシリアルサンプリングチェーンを必要とする。
拡散型IRモデルにおけるサンプリングチェーン全体をモデル化して解析解を導出する。
単イメージサンプリングを並列に行うことができ、トレーニングなしでHQイメージを復元することができます。
論文 参考訳(メタデータ) (2023-11-20T08:27:56Z) - Navigating protein landscapes with a machine-learned transferable
coarse-grained model [29.252004942896875]
同様の予測性能を持つ粗粒度(CG)モデルは、長年にわたる課題である。
ケミカルトランスポータビリティを持つボトムアップCG力場を開発し,新しい配列の分子動力学に利用することができる。
本モデルでは, 折り畳み構造, 中間体, メタスタブル折り畳み型および折り畳み型流域, 内在的に不規則なタンパク質のゆらぎの予測に成功している。
論文 参考訳(メタデータ) (2023-10-27T17:10:23Z) - Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical
Coarse-graining SO(3)-Equivariant Autoencoders [1.8835495377767553]
天然タンパク質の3次元ネイティブ状態は、繰り返しおよび階層的なパターンを示す。
従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。
オフィチュス(Ophiuchus)は、全原子タンパク質構造を効率的に操作するSO(3)等価な粗粒化モデルである。
論文 参考訳(メタデータ) (2023-10-04T01:01:11Z) - Backdiff: a diffusion model for generalized transferable protein
backmapping [9.815461018844523]
BackDiffは、タンパク質のバックマッピング問題における一般化と信頼性を実現するために設計された新しい生成モデルである。
本手法は,エンド・ツー・エンドのトレーニングを容易にするとともに,リトレーニングを必要とせず,異なるタンパク質および多様なCGモデルを効率的にサンプリングすることができる。
論文 参考訳(メタデータ) (2023-10-03T03:32:07Z) - Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。
これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文 参考訳(メタデータ) (2023-07-11T16:51:38Z) - Protein Discovery with Discrete Walk-Jump Sampling [54.588524248466406]
我々はスムーズなエネルギー関数を学び、ランゲヴィン・マルコフ連鎖モンテカルロの滑らかなデータ多様体からサンプリングし、一段階のデノイングで真のデータ多様体に投影する。
我々の離散ウォーク・ジャンプサンプリング形式は、エネルギーベースモデルの最大可能性トレーニングとスコアベースモデルのサンプル品質の改善を組み合わせたものである。
抗体タンパク質生成モデルにおける本手法のロバスト性を評価し, タンパク質生成モデルに分布整合性スコアを導入する。
論文 参考訳(メタデータ) (2023-06-08T17:03:46Z) - Chemically Transferable Generative Backmapping of Coarse-Grained
Proteins [0.0]
粗粒化(CG)は、原子の集合を特異なビーズとしてシミュレートすることでタンパク質力学のシミュレーションを加速する。
バックマッピングは、失われた原子論的な詳細をCG表現から取り戻すという逆の操作である。
この研究は、CGタンパク質表現のための高速で、転送可能で、信頼性の高い生成バックマッピングツールを構築する。
論文 参考訳(メタデータ) (2023-03-02T20:51:57Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Posterior Coreset Construction with Kernelized Stein Discrepancy for
Model-Based Reinforcement Learning [78.30395044401321]
我々は、強化学習(MBRL)のための新しいモデルベースアプローチを開発する。
ターゲット遷移モデルの仮定を緩和し、混合モデルの一般的な族に属する。
連続的な制御環境では、壁時計の時間を最大50%削減することができる。
論文 参考訳(メタデータ) (2022-06-02T17:27:49Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Sequence-guided protein structure determination using graph
convolutional and recurrent networks [0.0]
単一粒子、低温電子顕微鏡(cryo-EM)実験は、現在、大きなタンパク質の高分解能データを日常的に生成している。
この種のタスクの既存のプロトコルは、しばしば人間の介入に頼り、アウトプットを生成するのに数時間から何日もかかることがある。
ここでは、完全に自動化された、テンプレートなしのモデル構築アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-14T06:24:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。