論文の概要: Multimodal Protein Language Models for Enzyme Kinetic Parameters: From Substrate Recognition to Conformational Adaptation
- arxiv url: http://arxiv.org/abs/2603.12845v1
- Date: Fri, 13 Mar 2026 09:45:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:12.03384
- Title: Multimodal Protein Language Models for Enzyme Kinetic Parameters: From Substrate Recognition to Conformational Adaptation
- Title(参考訳): 酵素動態パラメータのための多モーダルタンパク質言語モデル:基質認識から構造適応へ
- Authors: Fei Wang, Xinye Zheng, Kun Li, Yanyan Wei, Yuxin Liu, Ganpeng Hu, Tong Bao, Jingwen Yang,
- Abstract要約: 酵素の速度論的パラメータの予測は、酵素が特定の基質をいかに効率的に触媒するかを定量化する。
多くの学習パイプラインは、このプロセスを酵素と基質間の静的な互換性問題に単純化する。
本稿では,タンパク質言語モデルへの微調整により,分子間情報を注入するERBA(Enzyme-Reaction Bridging Adapter)を提案する。
- 参考スコア(独自算出の注目度): 12.729882993671106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Predicting enzyme kinetic parameters quantifies how efficiently an enzyme catalyzes a specific substrate under defined biochemical conditions. Canonical parameters such as the turnover number ($k_\text{cat}$), Michaelis constant ($K_\text{m}$), and inhibition constant ($K_\text{i}$) depend jointly on the enzyme sequence, the substrate chemistry, and the conformational adaptation of the active site during binding. Many learning pipelines simplify this process to a static compatibility problem between the enzyme and substrate, fusing their representations through shallow operations and regressing a single value. Such formulations overlook the staged nature of catalysis, which involves both substrate recognition and conformational adaptation. In this regard, we reformulate kinetic prediction as a staged multimodal conditional modeling problem and introduce the Enzyme-Reaction Bridging Adapter (ERBA), which injects cross-modal information via fine-tuning into Protein Language Models (PLMs) while preserving their biochemical priors. ERBA performs conditioning in two stages: Molecular Recognition Cross-Attention (MRCA) first injects substrate information into the enzyme representation to capture specificity; Geometry-aware Mixture-of-Experts (G-MoE) then integrates active-site structure and routes samples to pocket-specialized experts to reflect induced fit. To maintain semantic fidelity, Enzyme-Substrate Distribution Alignment (ESDA) enforces distributional consistency within the PLM manifold in a reproducing kernel Hilbert space. Experiments across three kinetic endpoints and multiple PLM backbones, ERBA delivers consistent gains and stronger out-of-distribution performance compared with sequence-only and shallow-fusion baselines, offering a biologically grounded route to scalable kinetic prediction and a foundation for adding cofactors, mutations, and time-resolved structural cues.
- Abstract(参考訳): 酵素の速度論的パラメータの予測は、定義された生化学的条件下で酵素が特定の基質をいかに効率的に触媒するかを定量化する。
ターンオーバー数(k_\text{cat}$)、ミカリス定数(K_\text{m}$)、阻害定数(K_\text{i}$)などの標準パラメータは、結合中の酵素配列、基質化学、活性部位の配座適応に依存する。
多くの学習パイプラインは、このプロセスを酵素と基質間の静的な互換性の問題に単純化し、浅い操作を通じて表現を融合させ、単一の値を退避させる。
このような定式化は、基質認識とコンフォメーション適応の両方を含む触媒の段階的な性質を見落としている。
そこで本研究では, タンパク質言語モデル (PLM) に微調整を施し, 生化学的先行性を保ちながら, 動的予測を段階的マルチモーダル・コンディショナル・モデリング問題として再検討し, 酵素反応ブリッジング・アダプタ (ERBA) を導入する。
ERBAは2つの段階において条件付けを行う: 分子認識クロスアテンション(MRCA)は、まず基質情報を酵素表現に注入して特異性を捉える。
意味的忠実性を維持するために、酵素基板分布アライメント(ESDA)は、再生されたカーネルヒルベルト空間におけるPLM多様体内の分布一貫性を強制する。
3つの速度論的終端と複数のPLMバックボーンにわたる実験では、ERBAは、シーケンスのみのベースラインと浅い融合ベースラインと比較して、一貫したゲインとより強力なアウト・オブ・ディストリビューション性能を提供し、生物学的に基盤を置き、スケーラブルな速度論的予測へのルートを提供し、コファクター、突然変異、時間分解された構造的手がかりを追加する基盤を提供する。
関連論文リスト
- RXNRECer Enables Fine-grained Enzymatic Function Annotation through Active Learning and Protein Language Models [20.176405299884824]
RXNRECerは変換器をベースとしたアンサンブルフレームワークで、EC番号に依存しない酵素触媒反応を直接予測する。
タンパク質言語モデリングとアクティブラーニングを統合して、高レベルのシーケンスセマンティクスときめ細かい変換パターンの両方をキャプチャする。
論文 参考訳(メタデータ) (2026-03-13T06:20:14Z) - Mechanisms of AI Protein Folding in ESMFold [60.598995350547]
ESMFoldがいかにしてベータヘアピンを折りたたむかは、よく見られる構造モチーフである。
ESMFoldの構造決定の基盤となるメカニズムは局所化され、解釈可能な表現を通して追跡され、強い因果効果で操作されることを示す。
論文 参考訳(メタデータ) (2026-02-05T18:54:54Z) - Pseudodata-guided Invariant Representation Learning Boosts the Out-of-Distribution Generalization in Enzymatic Kinetic Parameter Prediction [12.238915133864046]
O$2$DENetは、OODの一般化を強化する軽量なプラグアンドプレイモジュールである。
O$2$DENetは酵素-基質の摂動を導入し、元の酵素-基質-ペアの表現と拡張された酵素-基質-ペアの表現の一貫性を強制する。
論文 参考訳(メタデータ) (2026-01-12T07:03:07Z) - EnzyCLIP: A Cross-Attention Dual Encoder Framework with Contrastive Learning for Predicting Enzyme Kinetic Constants [2.92594095183629]
本稿では,タンパク質配列および基質分子構造から酵素の動的パラメータを予測するための,新規な二重エンコーダフレームワークであるEnzyCLIPを提案する。
このモデルは23,151Kcatと41,174Kmの実験的に検証された測定値を含むCatPred-DBデータベースで訓練されている。
学習した埋め込みに適用されるXGBoostアンサンブル法は、堅牢なKcat性能を維持しつつ、さらにKm予測(R2 = 0.61)を改善した。
論文 参考訳(メタデータ) (2025-11-29T08:13:06Z) - Multimodal Regression for Enzyme Turnover Rates Prediction [57.60697333734054]
本稿では,酵素配列,基質構造,環境因子を統合することで,酵素の回転率を予測する枠組みを提案する。
我々のモデルは、事前訓練された言語モデルと畳み込みニューラルネットワークを組み合わせて、タンパク質配列から特徴を抽出する。
我々は、Kolmogorov-Arnold Networksを介して、酵素の回転率を管理する数学的公式を明示的に学習するために、シンボリックレグレッションを利用する。
論文 参考訳(メタデータ) (2025-09-15T11:07:26Z) - OmniESI: A unified framework for enzyme-substrate interaction prediction with progressive conditional deep learning [46.402707495664174]
条件付き深層学習による酵素-基質相互作用予測のための2段階プログレッシブフレームワークであるOmniESIを導入する。
我々は,OmniESIが最先端の特殊手法よりも優れた性能を実現していることを示す。
全体として、OmniESIは酵素-基質相互作用の統一的な予測手法である。
論文 参考訳(メタデータ) (2025-06-22T09:40:40Z) - Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。