論文の概要: Docking-Aware Attention: Dynamic Protein Representations through Molecular Context Integration
- arxiv url: http://arxiv.org/abs/2502.01461v1
- Date: Mon, 03 Feb 2025 15:52:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:53:26.613158
- Title: Docking-Aware Attention: Dynamic Protein Representations through Molecular Context Integration
- Title(参考訳): ドッキング・アウェア・アテンション:分子コンテキスト統合による動的タンパク質表現
- Authors: Amitay Sicherman, Kira Radinsky,
- Abstract要約: 動的にコンテキスト依存的なタンパク質表現を生成する新しいアーキテクチャであるDocking-Aware Attention (DAA)を提案する。
本手法は,従来の最先端手法よりも優れた酵素反応予測法である。
- 参考スコア(独自算出の注目度): 22.154465616964263
- License:
- Abstract: Computational prediction of enzymatic reactions represents a crucial challenge in sustainable chemical synthesis across various scientific domains, ranging from drug discovery to materials science and green chemistry. These syntheses rely on proteins that selectively catalyze complex molecular transformations. These protein catalysts exhibit remarkable substrate adaptability, with the same protein often catalyzing different chemical transformations depending on its molecular partners. Current approaches to protein representation in reaction prediction either ignore protein structure entirely or rely on static embeddings, failing to capture how proteins dynamically adapt their behavior to different substrates. We present Docking-Aware Attention (DAA), a novel architecture that generates dynamic, context-dependent protein representations by incorporating molecular docking information into the attention mechanism. DAA combines physical interaction scores from docking predictions with learned attention patterns to focus on protein regions most relevant to specific molecular interactions. We evaluate our method on enzymatic reaction prediction, where it outperforms previous state-of-the-art methods, achieving 62.2\% accuracy versus 56.79\% on complex molecules and 55.54\% versus 49.45\% on innovative reactions. Through detailed ablation studies and visualizations, we demonstrate how DAA generates interpretable attention patterns that adapt to different molecular contexts. Our approach represents a general framework for context-aware protein representation in biocatalysis prediction, with potential applications across enzymatic synthesis planning. We open-source our implementation and pre-trained models to facilitate further research.
- Abstract(参考訳): 酵素反応の計算的予測は、薬物発見から材料科学、緑の化学まで、様々な科学領域にわたる持続可能な化学合成において重要な課題である。
これらの合成は、複雑な分子変換を選択的に触媒するタンパク質に依存している。
これらのタンパク質触媒は顕著な基質適応性を示し、同じタンパク質は分子パートナーによって異なる化学変換を触媒することが多い。
反応予測におけるタンパク質表現への現在のアプローチは、タンパク質の構造を完全に無視するか、静的な埋め込みに依存し、タンパク質が異なる基質に動的にどのように適応するかを捉えていない。
本稿では,分子ドッキング情報を注目機構に組み込むことで,動的でコンテキスト依存的なタンパク質表現を生成する新しいアーキテクチャであるDocking-Aware Attention(DAA)を提案する。
DAAはドッキング予測の物理的相互作用スコアと学習された注意パターンを組み合わせて、特定の分子間相互作用に最も関係のあるタンパク質領域に焦点を当てる。
酵素反応予測法では, 従来の最先端法よりも62.2\%, 複素分子では56.79\%, 革新反応では55.54\%, 49.45\%に優れていた。
詳細なアブレーション研究と可視化を通じて、DAAが異なる分子文脈に適応する解釈可能な注意パターンをいかに生み出すかを実証する。
本手法は, 生体触媒の予測における文脈認識タンパク質表現の一般的な枠組みであり, 酵素合成計画にも応用できる可能性がある。
我々は、さらなる研究を促進するために、実装と事前訓練されたモデルをオープンソースにします。
関連論文リスト
- Agentic End-to-End De Novo Protein Design for Tailored Dynamics Using a Language Diffusion Model [0.5678271181959529]
VibeGenは、ノーマルモードの振動を条件としたエンド・ツー・エンドのデ・ノボタンパク質の設計を可能にする、ジェネレーティブなAIフレームワークである。
我々の研究は、タンパク質のダイナミクスを生成タンパク質の設計に統合し、配列と振動の振舞いの直接的な双方向リンクを確立する。
論文 参考訳(メタデータ) (2025-02-14T14:07:54Z) - ReactEmbed: A Cross-Domain Framework for Protein-Molecule Representation Learning via Biochemical Reaction Networks [22.154465616964263]
この研究は、分子とタンパク質間の相互作用を含む生化学反応を統合することで表現を強化する。
ReactEmbedは、コントラスト学習を通じて統合的な埋め込み空間を作成する新しい方法である。
薬物-標的相互作用,タンパク質-タンパク質相互作用,タンパク質特性予測,分子特性予測など,さまざまなタスクにまたがるReactEmbedの評価を行った。
論文 参考訳(メタデータ) (2025-01-30T11:34:03Z) - Computational Protein Science in the Era of Large Language Models (LLMs) [54.35488233989787]
計算タンパク質科学(Computational protein science)は、タンパク質配列構造-機能パラダイムにおける知識を明らかにすること、および応用を開発することを目的としている。
最近、言語モデル (Language Models, PLM) は、前例のない言語処理と一般化能力のために、AIのマイルストーンとして登場した。
論文 参考訳(メタデータ) (2025-01-17T16:21:18Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - Long-context Protein Language Model [76.95505296417866]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文 参考訳(メタデータ) (2024-10-29T16:43:28Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Improved K-mer Based Prediction of Protein-Protein Interactions With
Chaos Game Representation, Deep Learning and Reduced Representation Bias [0.0]
本稿では,対話データセットからユニークなペアを抽出し,非バイアス付き機械学習のための非冗長なペアデータを生成する手法を提案する。
我々は,タンパク質のコード遺伝子のカオスゲーム表現から相互作用を学習し,予測できる畳み込みニューラルネットワークモデルを開発した。
論文 参考訳(メタデータ) (2023-10-23T10:02:23Z) - Growing ecosystem of deep learning methods for modeling
protein$\unicode{x2013}$protein interactions [0.0]
本稿では,タンパク質相互作用をモデル化する深層学習手法のエコシステムを論じる。
新たな相互作用を発見し、物理的なメカニズムを調節し、エンジニアのバインダーがそれらの機能を解き放つ機会がある。
論文 参考訳(メタデータ) (2023-10-10T15:53:27Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Encoding protein dynamic information in graph representation for
functional residue identification [0.0]
タンパク質機能予測の最近の進歩は、タンパク質の構造的特徴とトポロジ的特徴と分子機能との相関をグラフベースの深層学習アプローチを用いている。
ここでは, 動的に相関する残基対間のエッジを連結することにより, ネイティブタンパク質コンホメーションと拡張タンパク質グラフに正規モード解析を適用した。
提案したグラフニューラルネットワークであるProDARは、残基レベルのアノテーションの解釈可能性と一般化性を高め、タンパク質の構造的ニュアンスを強く反映する。
論文 参考訳(メタデータ) (2021-12-15T17:57:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。