論文の概要: Unveiling Molecular Moieties through Hierarchical Grad-CAM Graph Explainability
- arxiv url: http://arxiv.org/abs/2402.01744v4
- Date: Thu, 17 Apr 2025 12:16:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-18 14:34:03.833242
- Title: Unveiling Molecular Moieties through Hierarchical Grad-CAM Graph Explainability
- Title(参考訳): 階層型Grad-CAMグラフ説明可能性による分子構造の解明
- Authors: Salvatore Contino, Paolo Sortino, Maria Rita Gulotta, Ugo Perricone, Roberto Pirrone,
- Abstract要約: 生物学的活性に対する分子サブストラクチャーの特定の寄与を解明するための説明可能な方法の統合は重要な課題である。
我々は,小分子のデータセットを用いて20個のGNNモデルを訓練し,キナーゼファミリーから20個のタンパク質標的上での活性を予測することを目標とした。
我々は階層型Grad-CAMグラフExplainerフレームワークを実装し,タンパク質-リガンド結合安定化を駆動する分子構造を詳細に解析する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Background: Virtual Screening (VS) has become an essential tool in drug discovery, enabling the rapid and cost-effective identification of potential bioactive molecules. Among recent advancements, Graph Neural Networks (GNNs) have gained prominence for their ability to model complex molecular structures using graph-based representations. However, the integration of explainable methods to elucidate the specific contributions of molecular substructures to biological activity remains a significant challenge. This limitation hampers both the interpretability of predictive models and the rational design of novel therapeutics.\\ Results: We trained 20 GNN models on a dataset of small molecules with the goal of predicting their activity on 20 distinct protein targets from the Kinase family. These classifiers achieved state-of-the-art performance in virtual screening tasks, demonstrating high accuracy and robustness on different targets. Building upon these models, we implemented the Hierarchical Grad-CAM graph Explainer (HGE) framework, enabling an in-depth analysis of the molecular moieties driving protein-ligand binding stabilization. HGE exploits Grad-CAM explanations at the atom, ring, and whole-molecule levels, leveraging the message-passing mechanism to highlight the most relevant chemical moieties. Validation against experimental data from the literature confirmed the ability of the explainer to recognize a molecular pattern of drugs and correctly annotate them to the known target. Conclusion: Our approach may represent a valid support to shorten both the screening and the hit discovery process. Detailed knowledge of the molecular substructures that play a role in the binding process can help the computational chemist to gain insights into the structure optimization, as well as in drug repurposing tasks.
- Abstract(参考訳): 背景: 仮想スクリーニング(VS)は薬物発見において重要なツールとなり、潜在的生物活性分子の迅速かつ費用対効果の高い同定を可能にした。
最近の進歩の中で、グラフベース表現を用いた複雑な分子構造をモデル化する能力において、グラフニューラルネットワーク(GNN)が注目されている。
しかし、分子サブストラクチャーの生物学的活性への貢献を解明するための説明可能な方法の統合は重要な課題である。
この制限は予測モデルの解釈可能性と新しい治療法の合理的設計の両方を妨げている。
結果: 小分子のデータセット上で20個のGNNモデルを訓練し, キナーゼファミリーから20個のタンパク質標的上での活性を予測することを目標とした。
これらの分類器は、仮想スクリーニングタスクにおいて最先端のパフォーマンスを達成し、異なるターゲットに対して高い精度と堅牢性を証明した。
これらのモデルに基づいて階層型Grad-CAM graph Explainer (HGE) フレームワークを実装し,タンパク質-リガンド結合安定化を駆動する分子構造を詳細に解析する。
HGEは、原子、環、および分子全体のGrad-CAM説明を利用して、メッセージ通過機構を利用して、最も関連性の高い化学反応をハイライトする。
文献からの実験データに対する検証は、説明者が薬物の分子パターンを認識し、それを既知の標的に正しくアノテートする能力を確認した。
結論:本手法は,スクリーニングとヒット発見プロセスの両方を短縮するための有効なサポートとなる可能性がある。
結合過程における分子サブストラクチャの詳細な知識は、計算化学者が構造最適化の洞察を得るのに役立つ。
関連論文リスト
- Neural Atoms: Propagating Long-range Interaction in Molecular Graphs through Efficient Communication Channel [48.6168145845412]
分子の原子を暗黙的に投影することで、原子群の集合情報を数$textitNeural Atoms$に抽象化する方法を提案する。
具体的には、ニューラル原子間で情報を明示的に交換し、それをエンハンスメントとして原子の表現に投影する。
この機構により、ニューラルネットワークは遠方のノード間の通信チャネルを確立し、任意のノード対の相互作用範囲を1つのホップに効果的に縮小する。
論文 参考訳(メタデータ) (2023-11-02T14:44:50Z) - ChiENN: Embracing Molecular Chirality with Graph Neural Networks [10.19088492223333]
本稿では,GNNをノード近傍の順序に敏感にする,理論的に正当化されたメッセージパス方式を提案する。
分子キラリティの文脈でこの概念を適用し、任意のGNNモデルに付加可能なキラルエッジニューラルネットワーク層を構築する。
GNNにChiENN層を追加することで、キラル感受性分子特性予測タスクにおける最先端の手法よりも優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2023-07-05T10:50:40Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - HiGNN: Hierarchical Informative Graph Neural Networks for Molecular
Property Prediction Equipped with Feature-Wise Attention [5.735627221409312]
分子特性を予測するための階層型情報グラフニューラルネットワークフレームワーク(HiGNN)を提案する。
実験により、HiGNNは、多くの挑戦的な薬物発見関連ベンチマークデータセットに対して最先端の予測性能を達成することが示された。
論文 参考訳(メタデータ) (2022-08-30T05:16:15Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - Improving Molecular Graph Neural Network Explainability with
Orthonormalization and Induced Sparsity [0.0]
GCNNのトレーニング中に適用する2つの簡単な正規化手法を提案します。
BROはグラフ畳み込み演算を奨励し、正規直交ノード埋め込みを生成する。
ギニ正規化は出力層の重みに適用され、モデルが予測するために使える次元の数を制約する。
論文 参考訳(メタデータ) (2021-05-11T08:13:34Z) - MEG: Generating Molecular Counterfactual Explanations for Deep Graph
Networks [11.291571222801027]
本稿では, 分子特性予測 t の文脈における深層グラフネットワークの説明可能性に取り組むための新しいアプローチを提案する。
我々は, 構造的類似度が高く, 予測特性の異なる(有意)化合物の形で, 特定の予測に対する情報的反実的説明を生成する。
モデルが非ML専門家に分子の近傍に焦点を絞った学習モデルに関する重要な洞察を伝達する方法を示す結果について議論する。
論文 参考訳(メタデータ) (2021-04-16T12:17:19Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。