論文の概要: Improving Enzyme Prediction with Chemical Reaction Equations by Hypergraph-Enhanced Knowledge Graph Embeddings
- arxiv url: http://arxiv.org/abs/2601.05330v1
- Date: Thu, 08 Jan 2026 19:17:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.750276
- Title: Improving Enzyme Prediction with Chemical Reaction Equations by Hypergraph-Enhanced Knowledge Graph Embeddings
- Title(参考訳): ハイパーグラフ強化知識グラフ埋め込みによる化学反応方程式による酵素予測の改善
- Authors: Tengwei Song, Long Yin, Zhen Han, Zhiqiang Xu,
- Abstract要約: 酵素と基質の相互作用を予測することは、長い間、生化学と代謝工学の基本的な問題であった。
既存の方法では、専門家が計算した酵素と基質のペアのデータベースを利用して、既知のペアの相互作用から学習することができる。
この十分なトレーニングデータの欠如は、従来の酵素予測モデルが目に見えない相互作用を一般化する能力を著しく妨げている。
- 参考スコア(独自算出の注目度): 7.848535217281907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting enzyme-substrate interactions has long been a fundamental problem in biochemistry and metabolic engineering. While existing methods could leverage databases of expert-curated enzyme-substrate pairs for models to learn from known pair interactions, the databases are often sparse, i.e., there are only limited and incomplete examples of such pairs, and also labor-intensive to maintain. This lack of sufficient training data significantly hinders the ability of traditional enzyme prediction models to generalize to unseen interactions. In this work, we try to exploit chemical reaction equations from domain-specific databases, given their easier accessibility and denser, more abundant data. However, interactions of multiple compounds, e.g., educts and products, with the same enzymes create complex relational data patterns that traditional models cannot easily capture. To tackle that, we represent chemical reaction equations as triples of (educt, enzyme, product) within a knowledge graph, such that we can take advantage of knowledge graph embedding (KGE) to infer missing enzyme-substrate pairs for graph completion. Particularly, in order to capture intricate relationships among compounds, we propose our knowledge-enhanced hypergraph model for enzyme prediction, i.e., Hyper-Enz, which integrates a hypergraph transformer with a KGE model to learn representations of the hyper-edges that involve multiple educts and products. Also, a multi-expert paradigm is introduced to guide the learning of enzyme-substrate interactions with both the proposed model and chemical reaction equations. Experimental results show a significant improvement, with up to a 88% relative improvement in average enzyme retrieval accuracy and 30% improvement in pair-level prediction compared to traditional models, demonstrating the effectiveness of our approach.
- Abstract(参考訳): 酵素と基質の相互作用を予測することは、長い間、生化学と代謝工学の基本的な問題であった。
既存の方法は、既知のペア相互作用から学習するモデルのために、専門家によって計算された酵素と基質のペアのデータベースを利用することができるが、データベースはしばしば疎結合である。
この十分なトレーニングデータの欠如は、従来の酵素予測モデルが目に見えない相互作用を一般化する能力を著しく妨げている。
本研究では,よりアクセシビリティが高く,より豊富なデータから,ドメイン固有データベースからの化学反応方程式の活用を試みる。
しかし、複数の化合物、例えばエダクトや生成物と同じ酵素との相互作用は、従来のモデルでは容易に捉えられない複雑な関係データパターンを生み出す。
そこで我々は, 化学反応方程式を知識グラフ内の三重項(エダクト, 酵素, 生成物)として表現し, 知識グラフ埋め込み(KGE)を利用して, 欠損した酵素-基質対をグラフ補完のために推算する。
特に、化合物間の複雑な関係を捉えるために、酵素予測のための知識強化ハイパーグラフモデル、すなわち、ハイパーグラフトランスフォーマーをKGEモデルに統合し、複数のエダクトや生成物を含むハイパーエッジの表現を学習するHyper-Enzを提案する。
また, 提案モデルと化学反応式の両方による酵素-基質相互作用の学習を導くために, マルチエキスパートパラダイムを導入した。
実験の結果, 平均酵素検索精度は88%, ペアレベルの予測は30%向上し, 提案手法の有効性が示された。
関連論文リスト
- Multimodal Regression for Enzyme Turnover Rates Prediction [57.60697333734054]
本稿では,酵素配列,基質構造,環境因子を統合することで,酵素の回転率を予測する枠組みを提案する。
我々のモデルは、事前訓練された言語モデルと畳み込みニューラルネットワークを組み合わせて、タンパク質配列から特徴を抽出する。
我々は、Kolmogorov-Arnold Networksを介して、酵素の回転率を管理する数学的公式を明示的に学習するために、シンボリックレグレッションを利用する。
論文 参考訳(メタデータ) (2025-09-15T11:07:26Z) - Binding Affinity Prediction: From Conventional to Machine Learning-Based Approaches [48.66541987908136]
過去数十年間、バインディング親和性を予測するために多くの作業が費やされてきた。
従来の機械学習モデルとディープラーニングモデルの両方を結合親和性を予測するために利用している点に注意が必要だ。
予測性能の改善とFDAの動物試験の廃止により、AI仮想細胞(AIVC)のようなサイリコモデルで駆動されるAIは、結合親和性予測を前進させる可能性がある。
論文 参考訳(メタデータ) (2024-09-30T03:40:49Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Graph Relation Distillation for Efficient Biomedical Instance
Segmentation [80.51124447333493]
本稿では,効率的なバイオメディカル・インスタンス・セグメンテーションのためのグラフ関係蒸留手法を提案する。
画像内レベルと画像間レベルの両方に展開する2つのグラフ蒸留方式を導入する。
多くのバイオメディカルデータセットの実験結果から,本手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-01-12T04:41:23Z) - Contrastive Multiview Coding for Enzyme-Substrate Interaction Prediction [0.0]
本稿では,この問題にContrastive Multiview Codingを適用し,予測性能を向上させるための新しい手法を提案する。
反応データの複数ビューの一致性は予測性能の向上に有効であることを示す。
論文 参考訳(メタデータ) (2021-11-18T01:18:36Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z) - Machine learning modeling of family wide enzyme-substrate specificity
screens [2.276367922551686]
バイオ触媒は、医薬品、複雑な天然物、商品化学物質を大規模に合成するための有望なアプローチである。
生体触媒の導入は、非天然基質上での化学的変換を触媒する酵素の選択能力によって制限される。
論文 参考訳(メタデータ) (2021-09-08T19:44:42Z) - DebiasedDTA: Model Debiasing to Boost Drug -- Target Affinity Prediction [0.10499611180329804]
DebiasedDTAは、新しい生体分子の親和性予測を促進するために、データセットバイアスを回避する最初のモデル脱バイアス手法である。
以上の結果から,DebiasedDTAは新規生体分子間の相互作用を予測しながらモデルを向上させることができることがわかった。
実験により、DebiasedDTAは異なる入力構造とモデル構造のDTA予測モデルを増大させることができることが示された。
論文 参考訳(メタデータ) (2021-07-04T19:21:37Z) - Enzyme promiscuity prediction using hierarchy-informed multi-label
classification [6.6828647808002595]
本稿では,983個の異なる酵素が問合せ分子と相互作用しうるかを予測するための機械学習モデルを提案し,評価する。
いくつかの相互作用は自然選択に起因し、酵素の天然基質を含む。
しかし、相互作用の大部分は非天然基質を含んでおり、プロミスキュラスな酵素活性を反映している。
論文 参考訳(メタデータ) (2020-02-18T01:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。