論文の概要: Structure-Aware Compound-Protein Affinity Prediction via Graph Neural Network with Group Lasso Regularization
- arxiv url: http://arxiv.org/abs/2507.03318v1
- Date: Fri, 04 Jul 2025 06:12:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:34.676266
- Title: Structure-Aware Compound-Protein Affinity Prediction via Graph Neural Network with Group Lasso Regularization
- Title(参考訳): グループラッソ正規化を用いたグラフニューラルネットワークによる構造認識化合物-プロテイン親和性予測
- Authors: Zanyu Shi, Yang Wang, Pathum Weerawarna, Jie Zhang, Timothy Richardson, Yijie Wang, Kun Huang,
- Abstract要約: 我々は、複合特性予測のための構造活性関係(SAR)モデリングのためのエンドツーエンドで説明可能な機械学習モデルを構築した。
グラフニューラルネットワーク (GNN) を用いて, 原子レベルの特徴情報を取得し, 複合タンパク質親和性を予測する。
また, グループラッソとスパースグループラッソを用いて, 分子サブグラフのプーンとハイライトを行い, 構造特異的モデル説明可能性を高める。
- 参考スコア(独自算出の注目度): 11.595051456139021
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Explainable artificial intelligence (XAI) approaches have been increasingly applied in drug discovery to learn molecular representations and identify substructures driving property predictions. However, building end-to-end explainable machine learning models for structure-activity relationship (SAR) modeling for compound property prediction faces many challenges, such as limited activity data per target and the sensitivity of properties to subtle molecular changes. To address this, we leveraged activity-cliff molecule pairs, i.e., compounds sharing a common scaffold but differing sharply in potency, targeting three proto-oncogene tyrosine-protein kinase Src proteins (i.e., PDB IDs 1O42, 2H8H, and 4MXO). We implemented graph neural network (GNN) methods to obtain atom-level feature information and predict compound-protein affinity (i.e., half maximal inhibitory concentration, IC50). In addition, we trained GNN models with different structure-aware loss functions to adequately leverage molecular property and structure information. We also utilized group lasso and sparse group lasso to prune and highlight molecular subgraphs and enhance the structure-specific model explainability for the predicted property difference in molecular activity-cliff pairs. We improved drug property prediction by integrating common and uncommon node information and using sparse group lasso, reducing the average root mean squared error (RMSE) by 12.70%, and achieving the lowest averaged RMSE=0.2551 and the highest PCC=0.9572. Furthermore, applying regularization enhances feature attribution methods that estimate the contribution of each atom in the molecular graphs by boosting global direction scores and atom-level accuracy in atom coloring accuracy, which improves model interpretability in drug discovery pipelines, particularly in investigating important molecular substructures in lead optimization.
- Abstract(参考訳): 説明可能な人工知能(XAI)アプローチは、分子表現を学習し、特性予測を駆動するサブ構造を特定するために、薬物発見にますます応用されている。
しかし、複合特性予測のための構造活性関係(SAR)モデリングのためのエンド・ツー・エンドの機械学習モデルの構築は、ターゲット当たりの限られた活動データや微妙な分子的変化に対する特性の感度など、多くの課題に直面している。
この問題に対処するために、活性-クリフ分子対、すなわち共通の足場を共有するが、機能的に著しく異なる化合物を利用して、3つのプロトオンコジーンチロシン-プロテインキナーゼSrcタンパク質(PDB ID 1O42, 2H8H, 4MXO)を標的とした。
グラフニューラルネットワーク (GNN) を用いて, 原子レベルの特徴情報を取得し, 化合物タンパク質親和性(ハーフマックス阻害濃度, IC50)を予測する。
さらに,分子特性と構造情報を適切に活用するために,異なる構造認識損失関数を持つGNNモデルを訓練した。
また,分子サブグラフのプーンとハイライト,および分子活性-クリフ対の予測特性差に対する構造特異的モデル説明可能性を高めるために,グループ・ラッソとスパース・グループ・ラッソを利用した。
我々は、共通ノード情報と非共通ノード情報を統合し、スパースグループラッソを用い、平均ルート平均二乗誤差(RMSE)を12.70%減少させ、最も低い平均RMSE=0.2551と最も高いPCC=0.9572を達成することにより、薬物特性予測を改善した。
さらに、正規化を適用することにより、分子グラフにおける各原子の寄与を推定する特徴属性法が、大域的な方向スコアと原子レベルの精度を原子彩色精度で向上させ、特に鉛最適化における重要な分子サブ構造の研究において、薬物発見パイプラインのモデル解釈性を向上させる。
関連論文リスト
- Learning Hierarchical Interaction for Accurate Molecular Property Prediction [8.488251667425887]
Hierarchical Interaction Message Net (HimNet)は、ADMETプロファイルを予測するための新しいディープラーニングモデルである。
HimNetは、ほとんどの分子特性予測タスクにおいて、最高の、または最も近いパフォーマンスを達成する。
HimNetは、分子活性とADMET特性予測のための正確で効率的なソリューションであると考えています。
論文 参考訳(メタデータ) (2025-04-28T15:19:28Z) - Adaptive Substructure-Aware Expert Model for Molecular Property Prediction [5.087741013479207]
グラフニューラルネットワーク(GNN)は分子を分子グラフとしてモデル化することで有望な結果を示す。
既存の方法は、しばしば異なるサブストラクチャーの分子特性への様々な貢献を見落としている。
分子特性予測にMixture-of-Experts(MoE)アプローチを利用する新しいGNNベースのフレームワークであるPhil-Molを提案する。
論文 参考訳(メタデータ) (2025-04-08T09:25:03Z) - Unveiling Molecular Moieties through Hierarchical Grad-CAM Graph Explainability [0.0]
生物学的活性に対する分子サブストラクチャーの特定の寄与を解明するための説明可能な方法の統合は重要な課題である。
我々は,小分子のデータセットを用いて20個のGNNモデルを訓練し,キナーゼファミリーから20個のタンパク質標的上での活性を予測することを目標とした。
我々は階層型Grad-CAMグラフExplainerフレームワークを実装し,タンパク質-リガンド結合安定化を駆動する分子構造を詳細に解析する。
論文 参考訳(メタデータ) (2024-01-29T17:23:25Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。