論文の概要: EnzyCLIP: A Cross-Attention Dual Encoder Framework with Contrastive Learning for Predicting Enzyme Kinetic Constants
- arxiv url: http://arxiv.org/abs/2512.00379v1
- Date: Sat, 29 Nov 2025 08:13:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.20612
- Title: EnzyCLIP: A Cross-Attention Dual Encoder Framework with Contrastive Learning for Predicting Enzyme Kinetic Constants
- Title(参考訳): EnzyCLIP: 酵素の速度定数予測のためのコントラスト学習を用いたクロスアテンションデュアルエンコーダフレームワーク
- Authors: Anas Aziz Khan, Md Shah Fahad, Priyanka, Ramesh Chandra, Guransh Singh,
- Abstract要約: 本稿では,タンパク質配列および基質分子構造から酵素の動的パラメータを予測するための,新規な二重エンコーダフレームワークであるEnzyCLIPを提案する。
このモデルは23,151Kcatと41,174Kmの実験的に検証された測定値を含むCatPred-DBデータベースで訓練されている。
学習した埋め込みに適用されるXGBoostアンサンブル法は、堅牢なKcat性能を維持しつつ、さらにKm予測(R2 = 0.61)を改善した。
- 参考スコア(独自算出の注目度): 2.92594095183629
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate prediction of enzyme kinetic parameters is crucial for drug discovery, metabolic engineering, and synthetic biology applications. Current computational approaches face limitations in capturing complex enzyme-substrate interactions and often focus on single parameters while neglecting the joint prediction of catalytic turnover numbers (Kcat) and Michaelis-Menten constants (Km). We present EnzyCLIP, a novel dual-encoder framework that leverages contrastive learning and cross-attention mechanisms to predict enzyme kinetic parameters from protein sequences and substrate molecular structures. Our approach integrates ESM-2 protein language model embeddings with ChemBERTa chemical representations through a CLIP-inspired architecture enhanced with bidirectional cross-attention for dynamic enzyme-substrate interaction modeling. EnzyCLIP combines InfoNCE contrastive loss with Huber regression loss to learn aligned multimodal representations while predicting log10-transformed kinetic parameters. The model is trained on the CatPred-DB database containing 23,151 Kcat and 41,174 Km experimentally validated measurements, and achieved competitive performance with R2 scores of 0.593 for Kcat and 0.607 for Km prediction. XGBoost ensemble methods applied to the learned embeddings further improved Km prediction (R2 = 0.61) while maintaining robust Kcat performance.
- Abstract(参考訳): 酵素の動態パラメータの正確な予測は、薬物発見、代謝工学、合成生物学の応用に不可欠である。
現在の計算手法では、複雑な酵素と基質の相互作用を捉え、触媒回転数 (Kcat) とミカエル・メンテン定数 (Km) の合同予測を無視しながら単一のパラメータに注目する。
本稿では, タンパク質配列や基質分子構造から酵素の反応パラメータを予測するために, コントラスト学習とクロスアテンション機構を活用する新しいデュアルエンコーダフレームワークであるEnzyCLIPを提案する。
提案手法はESM-2タンパク質言語モデルとCLIPにインスパイアされたアーキテクチャを用いてChemBERTaの化学表現を統合し, 動的酵素-基質相互作用モデリングのための双方向の相互アテンションを拡張した。
EnzyCLIPはInfoNCEの対照的な損失とHuberの回帰損失を組み合わせて、log10変換された運動パラメータを予測しながら、整列したマルチモーダル表現を学習する。
このモデルは23,151 Kcatと41,174 Kmを含むCatPred-DBデータベース上で訓練され、Kcatの0.593、Kmの0.607のR2スコアと競合性能を達成した。
学習した埋め込みに適用されるXGBoostアンサンブル法は、堅牢なKcat性能を維持しつつ、さらにKm予測(R2 = 0.61)を改善した。
関連論文リスト
- Multimodal Regression for Enzyme Turnover Rates Prediction [57.60697333734054]
本稿では,酵素配列,基質構造,環境因子を統合することで,酵素の回転率を予測する枠組みを提案する。
我々のモデルは、事前訓練された言語モデルと畳み込みニューラルネットワークを組み合わせて、タンパク質配列から特徴を抽出する。
我々は、Kolmogorov-Arnold Networksを介して、酵素の回転率を管理する数学的公式を明示的に学習するために、シンボリックレグレッションを利用する。
論文 参考訳(メタデータ) (2025-09-15T11:07:26Z) - KinForm: Kinetics Informed Feature Optimised Representation Models for Enzyme $k_{cat}$ and $K_{M}$ Prediction [0.0]
KinFormは、予測精度と運動パラメータの一般化を改善するために設計された機械学習フレームワークである。
我々は,結合部位の確率プーリング,中間層選択,PCA,低密度タンパク質のオーバーサンプリングの改善を観察した。
論文 参考訳(メタデータ) (2025-07-19T14:34:57Z) - OmniESI: A unified framework for enzyme-substrate interaction prediction with progressive conditional deep learning [46.402707495664174]
条件付き深層学習による酵素-基質相互作用予測のための2段階プログレッシブフレームワークであるOmniESIを導入する。
我々は,OmniESIが最先端の特殊手法よりも優れた性能を実現していることを示す。
全体として、OmniESIは酵素-基質相互作用の統一的な予測手法である。
論文 参考訳(メタデータ) (2025-06-22T09:40:40Z) - Binding Affinity Prediction: From Conventional to Machine Learning-Based Approaches [48.66541987908136]
過去数十年間、バインディング親和性を予測するために多くの作業が費やされてきた。
従来の機械学習モデルとディープラーニングモデルの両方を結合親和性を予測するために利用している点に注意が必要だ。
予測性能の改善とFDAの動物試験の廃止により、AI仮想細胞(AIVC)のようなサイリコモデルで駆動されるAIは、結合親和性予測を前進させる可能性がある。
論文 参考訳(メタデータ) (2024-09-30T03:40:49Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - From Static to Dynamic Structures: Improving Binding Affinity Prediction with Graph-Based Deep Learning [40.83037811977803]
Dynaformerは、タンパク質-リガンド結合親和性を予測するために開発されたグラフベースのディープラーニングモデルである。
CASF-2016ベンチマークデータセットでは、最先端のスコアとランキングの能力を示している。
熱ショックタンパク質90(HSP90)の仮想スクリーニングにおいて、20の候補を同定し、それらの結合親和性を実験的に検証する。
論文 参考訳(メタデータ) (2022-08-19T14:55:12Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。