Fugu-MT 論文翻訳(概要): DiAMoNDBack: Diffusion-denoising Autoregressive Model for Non-Deterministic Backmapping of C{\alpha} Protein Traces

論文の概要: DiAMoNDBack: Diffusion-denoising Autoregressive Model for Non-Deterministic Backmapping of C{\alpha} Protein Traces

arxiv url: http://arxiv.org/abs/2307.12451v1
Date: Sun, 23 Jul 2023 23:05:08 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-25 16:00:49.278392
Title: DiAMoNDBack: Diffusion-denoising Autoregressive Model for Non-Deterministic Backmapping of C{\alpha} Protein Traces
Title（参考訳）: DiAMoNDBack: C{\alpha}タンパク質の非決定論的バックマッピングのための拡散還元自己回帰モデル
Authors: Michael S. Jones and Kirill Shmilovich and Andrew L. Ferguson
Abstract要約: DiAMoNDBack は非決定論的バックマッピングのための自己回帰デノナイジング拡散確率モデルである。我々は、タンパク質データバンク(PDB)から65k以上の構造をトレーニングし、それをホールドアウトしたPDBテストセットにアプリケーションで検証する。 DiAMoNDBackは、フリーでオープンソースのPythonパッケージとして公開しています。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Coarse-grained molecular models of proteins permit access to length and time scales unattainable by all-atom models and the simulation of processes that occur on long-time scales such as aggregation and folding. The reduced resolution realizes computational accelerations but an atomistic representation can be vital for a complete understanding of mechanistic details. Backmapping is the process of restoring all-atom resolution to coarse-grained molecular models. In this work, we report DiAMoNDBack (Diffusion-denoising Autoregressive Model for Non-Deterministic Backmapping) as an autoregressive denoising diffusion probability model to restore all-atom details to coarse-grained protein representations retaining only C{\alpha} coordinates. The autoregressive generation process proceeds from the protein N-terminus to C-terminus in a residue-by-residue fashion conditioned on the C{\alpha} trace and previously backmapped backbone and side chain atoms within the local neighborhood. The local and autoregressive nature of our model makes it transferable between proteins. The stochastic nature of the denoising diffusion process means that the model generates a realistic ensemble of backbone and side chain all-atom configurations consistent with the coarse-grained C{\alpha} trace. We train DiAMoNDBack over 65k+ structures from Protein Data Bank (PDB) and validate it in applications to a hold-out PDB test set, intrinsically-disordered protein structures from the Protein Ensemble Database (PED), molecular dynamics simulations of fast-folding mini-proteins from DE Shaw Research, and coarse-grained simulation data. We achieve state-of-the-art reconstruction performance in terms of correct bond formation, avoidance of side chain clashes, and diversity of the generated side chain configurational states. We make DiAMoNDBack model publicly available as a free and open source Python package.
Abstract（参考訳）: タンパク質の粗い粒度の分子モデルは、全原子モデルでは達成できない長さと時間スケールへのアクセスと、凝集や折り畳みなどの長時間スケールで起こるプロセスのシミュレーションを可能にする。分解能の低下は計算加速度を実現するが、機械的詳細の完全な理解には原子論的な表現が不可欠である。バックマッピングは、全原子分解能を粗い分子モデルに復元するプロセスである。本研究では,DiaMoNDBack(Diffusion-denoising Autoregressive Model for Non-Deterministic Backmapping)を自己回帰分解拡散確率モデルとして報告し,全原子の詳細をC{\alpha}座標のみを保持する粗粒タンパク質表現に復元する。自己回帰生成過程は、C{\alpha}トレースに条件付き残基バイレジデント方式でタンパク質N末端からC末端へと進行し、以前は局所近傍のバックボーンと側鎖原子がバックマップされていた。我々のモデルにおける局所的および自己回帰的な性質は、タンパク質間の移動を可能にする。消音拡散過程の確率的性質は、モデルが粗粒c{\alpha}トレースと整合するバックボーンとサイドチェーンの全原子配置の現実的なアンサンブルを生成することを意味する。タンパク質データバンク (pdb) から65k以上の構造をダイアモンドバックし, ホールドアウト pdb テストセット, タンパク質アンサンブルデータベース (ped) による内在的不規則タンパク質構造, ド・ショー研究による高速折り畳みミニタンパク質の分子動力学シミュレーション, 粗粒度シミュレーションデータに適用した。我々は, 正しい結合形成, 側鎖衝突の回避, 生成側鎖構成状態の多様性の観点から, 最先端の再構築性能を実現する。 DiAMoNDBackモデルをフリーでオープンソースのPythonパッケージとして公開しています。

関連論文リスト

Protein Autoregressive Modeling via Multiscale Structure Generation [51.92004892768298]
タンパク質自己回帰モデリング(PAR)は,タンパク質のバックボーン生成のための最初のマルチスケール自己回帰フレームワークである。ノイズの多いコンテキスト学習とスケジュールサンプリングを採用し、堅牢なバックボーン生成を実現している。非条件生成ベンチマークでは、PARはタンパク質の分布を効果的に学習し、高い設計品質のバックボーンを生成する。
論文参考訳（メタデータ） (2026-02-04T18:59:49Z)
ProteinZero: Self-Improving Protein Generation via Online Reinforcement Learning [49.2607661375311]
本稿では,逆折り畳みモデルの計算的拡張性,自動化,継続的な自己改善を可能にする新しいフレームワークであるProteinZeroを提案する。 ProteinZeroは、タンパク質設計のすべての主要な指標において、既存の手法を大幅に上回っている。特に、CATH-4.3上で実行されるRL全体は、報酬を含む3日以内に1つの8X GPUノードで実行できる。
論文参考訳（メタデータ） (2025-06-09T06:08:59Z)
Energy-Based Coarse-Graining in Molecular Dynamics: A Flow-Based Framework Without Data [0.0]
本稿では,全原子ボルツマン分布を直接対象とする粗粒化のためのデータフリー生成フレームワークを提案する。完全な潜在空間から全原子構成空間への潜在的に学習可能な単射写像は、分子構造の自動的かつ正確な再構築を可能にする。
論文参考訳（メタデータ） (2025-04-29T17:05:27Z)
Learning conformational ensembles of proteins based on backbone geometry [1.1874952582465603]
本稿では,背骨形状のみに基づくタンパク質コンホメーションをサンプリングするためのフローマッチングモデルを提案する。結果として得られたモデルは、現在の最先端アプローチよりも桁違いに高速で、数日間でスクラッチからトレーニングできる。
論文参考訳（メタデータ） (2025-02-19T17:16:27Z)
Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文参考訳（メタデータ） (2025-02-14T03:26:57Z)
Diffusion Model with Representation Alignment for Protein Inverse Folding [53.139837825588614]
タンパク質逆フォールディングはバイオインフォマティクスの基本的な問題であり、与えられたタンパク質のバックボーン構造からアミノ酸配列を復元することを目的としている。表現アライメント(DMRA)を用いた拡散モデルを用いた新しい手法を提案する。実験では,CATH4.2データセットを広範囲に評価し,DMRAが先行手法より優れていることを示す。
論文参考訳（メタデータ） (2024-12-12T15:47:59Z)
SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文参考訳（メタデータ） (2024-10-31T15:22:03Z)
Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。 DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文参考訳（メタデータ） (2024-10-17T15:10:13Z)
The Latent Road to Atoms: Backmapping Coarse-grained Protein Structures with Latent Diffusion [19.85659309869674]
潜伏拡散バックマッピング(LDB)は、これらの課題に対処するために潜伏空間内での拡散をデノナイズする新しいアプローチである。 3つの異なるタンパク質データセット上でLDBの最先端性能を評価する。計算生物学におけるCGシミュレーションと原子レベル解析のギャップを効果的に埋め、LDBをバックマッピングのための強力でスケーラブルなアプローチとして位置づけた。
論文参考訳（メタデータ） (2024-10-17T06:38:07Z)
Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。私たちのフレームワークは、3つの新しい目標のファミリーにつながります。 Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文参考訳（メタデータ） (2024-10-10T17:18:30Z)
Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文参考訳（メタデータ） (2024-03-21T02:44:08Z)
Navigating protein landscapes with a machine-learned transferable coarse-grained model [29.252004942896875]
同様の予測性能を持つ粗粒度(CG)モデルは、長年にわたる課題である。ケミカルトランスポータビリティを持つボトムアップCG力場を開発し,新しい配列の分子動力学に利用することができる。本モデルでは, 折り畳み構造, 中間体, メタスタブル折り畳み型および折り畳み型流域, 内在的に不規則なタンパク質のゆらぎの予測に成功している。
論文参考訳（メタデータ） (2023-10-27T17:10:23Z)
Ophiuchus: Scalable Modeling of Protein Structures through Hierarchical Coarse-graining SO(3)-Equivariant Autoencoders [1.8835495377767553]
天然タンパク質の3次元ネイティブ状態は、繰り返しおよび階層的なパターンを示す。従来のグラフに基づくタンパク質構造のモデリングは、単一の微細な解像度でしか動作しないことが多い。オフィチュス(Ophiuchus)は、全原子タンパク質構造を効率的に操作するSO(3)等価な粗粒化モデルである。
論文参考訳（メタデータ） (2023-10-04T01:01:11Z)
Chemically Transferable Generative Backmapping of Coarse-Grained Proteins [0.0]
粗粒化(CG)は、原子の集合を特異なビーズとしてシミュレートすることでタンパク質力学のシミュレーションを加速する。バックマッピングは、失われた原子論的な詳細をCG表現から取り戻すという逆の操作である。この研究は、CGタンパク質表現のための高速で、転送可能で、信頼性の高い生成バックマッピングツールを構築する。
論文参考訳（メタデータ） (2023-03-02T20:51:57Z)
State-specific protein-ligand complex structure prediction with a multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文参考訳（メタデータ） (2022-09-30T01:46:38Z)
Learning Geometrically Disentangled Representations of Protein Folding Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文参考訳（メタデータ） (2022-05-20T19:38:00Z)
Sequence-guided protein structure determination using graph convolutional and recurrent networks [0.0]
単一粒子、低温電子顕微鏡(cryo-EM)実験は、現在、大きなタンパク質の高分解能データを日常的に生成している。この種のタスクの既存のプロトコルは、しばしば人間の介入に頼り、アウトプットを生成するのに数時間から何日もかかることがある。ここでは、完全に自動化された、テンプレートなしのモデル構築アプローチを提案する。
論文参考訳（メタデータ） (2020-07-14T06:24:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。