論文の概要: Structure-Aware Compound-Protein Affinity Prediction via Graph Neural Network with Group Lasso Regularization
- arxiv url: http://arxiv.org/abs/2507.03318v2
- Date: Tue, 07 Oct 2025 21:09:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 14:21:18.060463
- Title: Structure-Aware Compound-Protein Affinity Prediction via Graph Neural Network with Group Lasso Regularization
- Title(参考訳): グループラッソ正規化を用いたグラフニューラルネットワークによる構造認識化合物-プロテイン親和性予測
- Authors: Zanyu Shi, Yang Wang, Pathum Weerawarna, Jie Zhang, Timothy Richardson, Yijie Wang, Kun Huang,
- Abstract要約: 化合物タンパク質親和性を予測するためにグラフニューラルネットワーク(GNN)を実装したフレームワークを提案する。
我々は、グループラッソとスパースグループラッソカラー化正規化を用いて、構造認識損失関数を持つGNNを訓練する。
提案手法は,共通ノード情報と非共通ノード情報をスパースグループラッソに統合することにより,特性予測を改善した。
- 参考スコア(独自算出の注目度): 11.87029706744257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Explainable artificial intelligence (XAI) approaches have been increasingly applied in drug discovery to learn molecular representations and identify substructures driving property predictions. However, building end-to-end explainable models for structure-activity relationship (SAR) modeling for compound property prediction faces many challenges, such as the limited number of compound-protein interaction activity data for specific protein targets, and plenty of subtle changes in molecular configuration sites significantly affecting molecular properties. We exploit pairs of molecules with activity cliffs that share scaffolds but differ at substituent sites, characterized by large potency differences for specific protein targets. We propose a framework by implementing graph neural networks (GNNs) to leverage property and structure information from activity cliff pairs to predict compound-protein affinity (i.e., half maximal inhibitory concentration, IC50). To enhance model performance and explainability, we train GNNs with structure-aware loss functions using group lasso and sparse group lasso regularizations, which prune and highlight molecular subgraphs relevant to activity differences. We applied this framework to activity cliff data of molecules targeting three proto-oncogene tyrosine-protein kinase Src proteins (PDB IDs: 1O42, 2H8H, 4MXO). Our approach improved property prediction by integrating common and uncommon node information with sparse group lasso, as reflected in reduced root mean squared error (RMSE) and improved Pearson's correlation coefficient (PCC). Applying regularizations also enhances feature attribution for GNN by boosting graph-level global direction scores and improving atom-level coloring accuracy. These advances strengthen model interpretability in drug discovery pipelines, particularly for identifying critical molecular substructures in lead optimization.
- Abstract(参考訳): 説明可能な人工知能(XAI)アプローチは、分子表現を学習し、特性予測を駆動するサブ構造を特定するために、薬物発見にますます応用されている。
しかし、複雑な性質予測のための構造-活性関係(SAR)モデリングのためのエンド・ツー・エンドの説明可能なモデルの構築には、特定のタンパク質標的に対する複合体-タンパク質相互作用活性データの限られた数や、分子構造部位の微妙な変化が分子特性に大きな影響を及ぼすなど、多くの課題に直面している。
我々は,足場を共有するが,特定のタンパク質標的に対して大きな有効性の違いが特徴の置換部位で異なる活性崖を持つ分子のペアを利用する。
本稿では, グラフニューラルネットワーク(GNN)を用いて, 活性崖対からの物性と構造情報を利用して, 複合タンパク質親和性(ハーフマックス阻害濃度, IC50)を予測する枠組みを提案する。
モデル性能と説明可能性を高めるため,グループラッソとスパースグループラッソ正規化を用いた構造認識損失関数を用いたGNNの訓練を行った。
この枠組みを3つのプロトオンコジンチロシンキナーゼSrcタンパク質(PDB ID: 1O42, 2H8H, 4MXO)を標的とした分子の活性崖データに適用した。
提案手法は, 還元根平均二乗誤差 (RMSE) に反映される共通ノード情報と非共通ノード情報とスパースグループラッソを統合することで特性予測を改善し, ピアソン相関係数 (PCC) を改良した。
正規化を適用することで、グラフレベルのグローバルな方向スコアを向上し、原子レベルの色付け精度を向上させることにより、GNNの機能属性も向上する。
これらの進歩は、特に鉛最適化における重要な分子サブ構造を特定するために、薬物発見パイプラインのモデル解釈可能性を強化する。
関連論文リスト
- Learning Hierarchical Interaction for Accurate Molecular Property Prediction [8.488251667425887]
Hierarchical Interaction Message Net (HimNet)は、ADMETプロファイルを予測するための新しいディープラーニングモデルである。
HimNetは、ほとんどの分子特性予測タスクにおいて、最高の、または最も近いパフォーマンスを達成する。
HimNetは、分子活性とADMET特性予測のための正確で効率的なソリューションであると考えています。
論文 参考訳(メタデータ) (2025-04-28T15:19:28Z) - Adaptive Substructure-Aware Expert Model for Molecular Property Prediction [5.087741013479207]
グラフニューラルネットワーク(GNN)は分子を分子グラフとしてモデル化することで有望な結果を示す。
既存の方法は、しばしば異なるサブストラクチャーの分子特性への様々な貢献を見落としている。
分子特性予測にMixture-of-Experts(MoE)アプローチを利用する新しいGNNベースのフレームワークであるPhil-Molを提案する。
論文 参考訳(メタデータ) (2025-04-08T09:25:03Z) - Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Unveiling Molecular Moieties through Hierarchical Grad-CAM Graph Explainability [0.0]
生物学的活性に対する分子サブストラクチャーの特定の寄与を解明するための説明可能な方法の統合は重要な課題である。
我々は,小分子のデータセットを用いて20個のGNNモデルを訓練し,キナーゼファミリーから20個のタンパク質標的上での活性を予測することを目標とした。
我々は階層型Grad-CAMグラフExplainerフレームワークを実装し,タンパク質-リガンド結合安定化を駆動する分子構造を詳細に解析する。
論文 参考訳(メタデータ) (2024-01-29T17:23:25Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。