論文の概要: Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings
- arxiv url: http://arxiv.org/abs/2506.17064v1
- Date: Fri, 20 Jun 2025 15:12:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.504113
- Title: Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings
- Title(参考訳): グラフ埋め込みへの潜伏拡散を用いたフル原子タンパク質コンフォーメーションの生成モデリング
- Authors: Aditya Sengar, Ali Hariri, Daniel Probst, Patrick Barth, Pierre Vandergheynst,
- Abstract要約: 完全な全原子タンパク質構造を構築するフレームワークであるフルタンパク質生成(LD-FPG)の潜在拡散について述べる。
LD-FPGは、チェビシェフグラフニューラルネットワーク(ChebNet)を用いて、タンパク質コンホメーションの低次元潜伏埋め込みを得る。
膜環境におけるヒトドーパミンD2受容体の2マイクロ秒MD軌道であるD2R-MDを用いて、シーケンシャルおよび残基ベースプール戦略は、高い構造的忠実度で参照アンサンブルを再現する。
- 参考スコア(独自算出の注目度): 3.865956785180468
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating diverse, all-atom conformational ensembles of dynamic proteins such as G-protein-coupled receptors (GPCRs) is critical for understanding their function, yet most generative models simplify atomic detail or ignore conformational diversity altogether. We present latent diffusion for full protein generation (LD-FPG), a framework that constructs complete all-atom protein structures, including every side-chain heavy atom, directly from molecular dynamics (MD) trajectories. LD-FPG employs a Chebyshev graph neural network (ChebNet) to obtain low-dimensional latent embeddings of protein conformations, which are processed using three pooling strategies: blind, sequential and residue-based. A diffusion model trained on these latent representations generates new samples that a decoder, optionally regularized by dihedral-angle losses, maps back to Cartesian coordinates. Using D2R-MD, a 2-microsecond MD trajectory (12 000 frames) of the human dopamine D2 receptor in a membrane environment, the sequential and residue-based pooling strategy reproduces the reference ensemble with high structural fidelity (all-atom lDDT of approximately 0.7; C-alpha-lDDT of approximately 0.8) and recovers backbone and side-chain dihedral-angle distributions with a Jensen-Shannon divergence of less than 0.03 compared to the MD data. LD-FPG thereby offers a practical route to system-specific, all-atom ensemble generation for large proteins, providing a promising tool for structure-based therapeutic design on complex, dynamic targets. The D2R-MD dataset and our implementation are freely available to facilitate further research.
- Abstract(参考訳): Gタンパク質結合受容体(GPCR)のような動的タンパク質の多様な全原子コンフォメーションアンサンブルを生成することは、その機能を理解する上で重要であるが、ほとんどの生成モデルは原子の詳細を単純化するか、コンフォメーションの多様性を完全に無視する。
分子動力学(MD)軌道から直接、すべての側鎖重原子を含む完全な全原子タンパク質構造を構築するフレームワークであるフルタンパク質生成(LD-FPG)の潜在拡散について述べる。
LD-FPGは、チェビシェフグラフニューラルネットワーク(ChebNet)を用いて、タンパク質コンホメーションの低次元潜伏埋め込みを得る。
これらの潜在表現に基づいて訓練された拡散モデルは、二面角損失によって任意に正規化されたデコーダがカルテ座標に写像する新しいサンプルを生成する。
膜環境下でのヒトドーパミンD2受容体の2マイクロ秒MD軌道(12万フレーム)であるD2R-MDを用いて、シーケンシャルおよび残基に基づくプール戦略は、高い構造的忠実度(全原子lDDTは約0.7; C-アルファlDDT約0.8)の基準アンサンブルを再現し、Jensen-Shannonのばらつきで背骨と側鎖の2面角分布を回復する。
これによりLD-FPGは、システム固有の全原子アンサンブル生成への実用的な経路を提供し、複雑な動的標的に対する構造に基づく治療設計のための有望なツールを提供する。
D2R-MDデータセットと我々の実装は、さらなる研究を促進するために自由に利用可能である。
関連論文リスト
- Generative Distribution Embeddings [1.3252809892089024]
本稿では,自動エンコーダを分散空間に引き上げるフレームワークである生成分布埋め込み(GDE)を紹介する。
GDEでは、エンコーダがサンプルの集合に作用し、デコーダは入力分布にマッチするジェネレータに置き換えられる。
GDEを計算生物学の6つの重要な問題に適用する。
論文 参考訳(メタデータ) (2025-05-23T17:58:57Z) - Energy-Based Coarse-Graining in Molecular Dynamics: A Flow-Based Framework Without Data [0.0]
本稿では,全原子ボルツマン分布を直接対象とする粗粒化のためのデータフリー生成フレームワークを提案する。
完全な潜在空間から全原子構成空間への潜在的に学習可能な単射写像は、分子構造の自動的かつ正確な再構築を可能にする。
論文 参考訳(メタデータ) (2025-04-29T17:05:27Z) - Towards Unified and Lossless Latent Space for 3D Molecular Latent Diffusion Modeling [77.26556208024633]
3次元分子生成は、薬物発見と物質科学に不可欠である。
既存のアプローチは、典型的には不変かつ同変なモジュラリティに対して別々のラテント空間を保持する。
我々は,3次元分子を潜在空間から潜在配列に圧縮するマルチモーダルVAEである textbfUAE-3D を提案する。
論文 参考訳(メタデータ) (2025-03-19T08:56:13Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Diffusion Language Models Are Versatile Protein Learners [75.98083311705182]
本稿では,タンパク質配列の強い生成および予測能力を示す多目的なタンパク質言語モデルである拡散タンパク質言語モデル(DPLM)を紹介する。
まず, 自己制御型離散拡散確率フレームワークを用いて, 進化的タンパク質配列からのスケーラブルDPLMの事前学習を行った。
プレトレーニング後、DPLMは非条件生成のための構造的に可塑性で新規で多様なタンパク質配列を生成する能力を示す。
論文 参考訳(メタデータ) (2024-02-28T18:57:56Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - In-Pocket 3D Graphs Enhance Ligand-Target Compatibility in Generative
Small-Molecule Creation [0.0]
本稿では,関係グラフアーキテクチャ内の3次元タンパク質-リガンド接触を符号化したグラフベース生成モデリング技術を提案する。
これらのモデルは、活性特異的な分子生成を可能にする条件付き変分オートエンコーダと、ターゲットの結合ポケット内の分子相互作用の予測を提供する配置接触生成を組み合わせる。
論文 参考訳(メタデータ) (2022-04-05T22:53:51Z) - Sequence-guided protein structure determination using graph
convolutional and recurrent networks [0.0]
単一粒子、低温電子顕微鏡(cryo-EM)実験は、現在、大きなタンパク質の高分解能データを日常的に生成している。
この種のタスクの既存のプロトコルは、しばしば人間の介入に頼り、アウトプットを生成するのに数時間から何日もかかることがある。
ここでは、完全に自動化された、テンプレートなしのモデル構築アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-14T06:24:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。