論文の概要: Representing local protein environments with atomistic foundation models
- arxiv url: http://arxiv.org/abs/2505.23354v1
- Date: Thu, 29 May 2025 11:25:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.828872
- Title: Representing local protein environments with atomistic foundation models
- Title(参考訳): 原子基盤モデルを用いた局所タンパク質環境の表現
- Authors: Meital Bojan, Sanketh Vedula, Advaith Maddipatla, Nadav Bojan Sellam, Federico Napoli, Paul Schanda, Alex M. Bronstein,
- Abstract要約: 原子基盤モデル(AFM)の中間的特徴から得られた局所タンパク質環境の表現法を提案する。
AFMから導かれる表現空間は有意義な構造を示し、データ駆動の事前構築を可能にする。
生体分子NMR分光法(英語版)の文脈において、提案された表現により、第一種物理学インフォームド化学シフト予測器が実現できることを実証する。
- 参考スコア(独自算出の注目度): 6.120694232253299
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The local structure of a protein strongly impacts its function and interactions with other molecules. Therefore, a concise, informative representation of a local protein environment is essential for modeling and designing proteins and biomolecular interactions. However, these environments' extensive structural and chemical variability makes them challenging to model, and such representations remain under-explored. In this work, we propose a novel representation for a local protein environment derived from the intermediate features of atomistic foundation models (AFMs). We demonstrate that this embedding effectively captures both local structure (e.g., secondary motifs), and chemical features (e.g., amino-acid identity and protonation state). We further show that the AFM-derived representation space exhibits meaningful structure, enabling the construction of data-driven priors over the distribution of biomolecular environments. Finally, in the context of biomolecular NMR spectroscopy, we demonstrate that the proposed representations enable a first-of-its-kind physics-informed chemical shift predictor that achieves state-of-the-art accuracy. Our results demonstrate the surprising effectiveness of atomistic foundation models and their emergent representations for protein modeling beyond traditional molecular simulations. We believe this will open new lines of work in constructing effective functional representations for protein environments.
- Abstract(参考訳): タンパク質の局所構造は、その機能と他の分子との相互作用に強く影響を及ぼす。
したがって、タンパク質や生体分子の相互作用をモデル化し、設計するためには、局所的なタンパク質環境の簡潔で情報的な表現が不可欠である。
しかしながら、これらの環境の広範な構造的・化学的変動はモデリングを困難にしており、これらの表現は未探索のままである。
本研究では,原子論基盤モデル(AFM)の中間的特徴から得られた局所タンパク質環境の表現法を提案する。
この埋め込みは局所構造(eg, 二次モチーフ)と化学的特徴(eg, アミノ酸の同一性, プロトン化状態)の両方を効果的に捉えることを実証した。
さらに、AFM由来の表現空間は有意義な構造を示し、生体分子環境の分布に関するデータ駆動の事前構築を可能にした。
最後に、生体分子NMR分光の文脈において、提案された表現が、最先端の精度を達成する第一種物理学インフォームド化学シフト予測器を可能にすることを実証する。
本研究は,従来の分子シミュレーションを超越したタンパク質モデリングにおける原子基盤モデルとその創発的表現の驚くべき有効性を示すものである。
これにより、タンパク質環境に対する効果的な機能的表現を構築するための新たな作業が開かれると我々は信じている。
関連論文リスト
- A Generalist Cross-Domain Molecular Learning Framework for Structure-Based Drug Discovery [32.573496601865465]
構造に基づく薬物発見(Structure-based drug discovery、SBDD)は、標的タンパク質の詳細な物理的構造を利用して新しい薬物を開発する体系的な科学的プロセスである。
生体分子の事前学習モデルの最近の進歩は、様々な生化学的応用において顕著な成功を収めている。
論文 参考訳(メタデータ) (2025-03-06T12:04:56Z) - AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文 参考訳(メタデータ) (2024-04-02T14:44:02Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z) - A silicon qubit platform for in situ single molecule structure
determination [0.7187911114620571]
単分子レベルでの一般、不均一、過渡的または内在的に混乱したタンパク質系の個々のコンフォメーションのインスタンスをイメージングすることは、構造生物学における顕著な課題の1つである。
ここでは、シリコンベースのスピン量子ビットの利点を取り入れた単一の分子イメージングプラットフォームを設計することで、この問題に取り組む。
我々は,本プラットフォームが自然環境における個々の分子系のスケーラブルな原子レベル構造決定を可能にすることを,詳細なシミュレーションを通じて実証した。
論文 参考訳(メタデータ) (2021-12-07T10:42:09Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - Energy-based models for atomic-resolution protein conformations [88.68597850243138]
原子スケールで動作するタンパク質コンホメーションのエネルギーモデル(EBM)を提案する。
このモデルは、結晶化されたタンパク質のデータにのみ訓練されている。
モデル出力と隠された表現の研究により、タンパク質エネルギーに関連する物理化学的性質を捉えることが判明した。
論文 参考訳(メタデータ) (2020-04-27T20:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。