論文の概要: Pharmacology Knowledge Graphs: Do We Need Chemical Structure for Drug Repurposing?
- arxiv url: http://arxiv.org/abs/2603.01537v1
- Date: Mon, 02 Mar 2026 07:07:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.729187
- Title: Pharmacology Knowledge Graphs: Do We Need Chemical Structure for Drug Repurposing?
- Title(参考訳): 薬理学知識グラフ:医薬品のリサイクルには化学構造が必要か?
- Authors: Youssef Abo-Dahab, Ruby Hernandez, Ismael Caleb Arechiga Duran,
- Abstract要約: 我々はChEMBL 36から,3,127薬,1,156タンパク質,1,065の表示を含む5,348のエンティティからなる薬理知識グラフを構築した。
我々は、5つの知識グラフ埋め込みモデルと、344万のパラメータを持つ標準グラフニューラルネットワークをグラフアテンションエンコーダとESM-2タンパク質埋め込みを用いてベンチマークした。
グラフアテンションに基づく薬物構造エンコーダを除去し、ESM-2タンパク質と組み合わせたトポロジカル埋め込みのみを保持することで、ドラッグタンパク質PR-AUCを0.5631から0.5785に改善し、VRAMをGBから353MBに削減した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The contributions of model complexity, data volume, and feature modalities to knowledge graph-based drug repurposing remain poorly quantified under rigorous temporal validation. We constructed a pharmacology knowledge graph from ChEMBL 36 comprising 5,348 entities including 3,127 drugs, 1,156 proteins, and 1,065 indications. A strict temporal split was enforced with training data up to 2022 and testing data from 2023 to 2025, together with biologically verified hard negatives mined from failed assays and clinical trials. We benchmarked five knowledge graph embedding models and a standard graph neural network with 3.44 million parameters that incorporates drug chemical structure using a graph attention encoder and ESM-2 protein embeddings. Scaling experiments ranging from 0.78 to 9.75 million parameters and from 25 to 100 percent of the data, together with feature ablation studies, were used to isolate the contributions of model capacity, graph density, and node feature modalities. Removing the graph attention based drug structure encoder and retaining only topological embeddings combined with ESM-2 protein features improved drug protein PR-AUC from 0.5631 to 0.5785 while reducing VRAM usage from 5.30 GB to 353 MB. Replacing the drug encoder with Morgan fingerprints further degraded performance, indicating that explicit chemical structure representations can be detrimental for predicting pharmacological network interactions. Increasing model size beyond 2.44 million parameters yielded diminishing returns, whereas increasing training data consistently improved performance. External validation confirmed 6 of the top 14 novel predictions as established therapeutic indications. These results show that drug pharmacological behavior can be accurately predicted using target-centric information and drug network topology alone, without requiring explicit chemical structure representations.
- Abstract(参考訳): 厳密な時間的検証の下では, モデル複雑性, データ量, 特徴量による知識グラフに基づく薬物再資源化の寄与は, 十分に定量化されていない。
我々はChEMBL 36から,3,127薬,1,156タンパク質,1,065の表示を含む5,348のエンティティからなる薬理知識グラフを構築した。
2022年までの訓練データと2023年から2025年までの試験データと、診断の失敗と臨床試験から得られた生物学的に検証された硬い陰性で厳密な時間分割が実施された。
我々は、5つの知識グラフ埋め込みモデルと、344万のパラメータを持つ標準グラフニューラルネットワークをグラフアテンションエンコーダとESM-2タンパク質埋め込みを用いてベンチマークした。
0.78から9.75万のパラメータ、25から100%のデータを含むスケーリング実験は、モデルキャパシティ、グラフ密度、ノード特性のモダリティの寄与を分離するために用いられた。
グラフアテンションに基づく薬物構造エンコーダを除去し、ESM-2タンパク質と組み合わせたトポロジカル埋め込みのみを保持することにより、ドラッグタンパク質PR-AUCは 0.5631 から 0.5785 に改善され、VRAM使用量は 5.30 GB から 353 MB に削減された。
薬物エンコーダをモーガンの指紋で置き換えることでさらに性能が低下し、薬理学的ネットワーク相互作用を予測するのに明確な化学構造表現が有害であることが示唆された。
2.44万のパラメータを超えるモデルサイズの増加はリターンの低下をもたらし、トレーニングデータの増加はパフォーマンスを継続的に改善した。
外的検証は、確立された治療適応として、トップ14の新規予測のうち6つを確認した。
これらの結果から, 薬物の薬理学的挙動は, 明確な化学構造表現を必要とせず, 標的中心情報と薬物ネットワークトポロジーのみを用いて正確に予測できることが示唆された。
関連論文リスト
- MMM: Quantum-Chemical Molecular Representation Learning for Combinatorial Drug Recommendation [5.017879531498458]
共同処方薬間の薬物・薬物相互作用(DDI)は依然として重要な課題である。
分子電子局在関数(ELF)マップ(MMM)を用いたマルチモーダルDDI予測を提案する。
MMMは、グローバル電子特性を符号化するELFに由来する特徴と、局所的なサブ構造相互作用をモデル化する二部グラフエンコーダを組み合わせる。
以上の結果から,ALFをベースとした3D表現の予測精度の向上と,臨床実践における薬剤処方の安全性向上が示唆された。
論文 参考訳(メタデータ) (2025-10-09T08:03:14Z) - Drug Repurposing Using Deep Embedded Clustering and Graph Neural Networks [10.858347895657737]
教師なし深層クラスタリングと教師付きグラフニューラルネットワークリンク予測を組み合わせた機械学習パイプラインを提案する。
合計で9,022種類の薬物が35個のクラスターに分割され、平均シルエットスコアは0.8550である。
グラフニューラルネットワークは、0.901の予測精度、0.960の曲線下での受信特性領域、0.901のF1スコアなど、強い統計的性能を達成した。
論文 参考訳(メタデータ) (2025-09-15T01:04:37Z) - Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。
分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。
細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文 参考訳(メタデータ) (2025-07-22T04:35:50Z) - GramSeq-DTA: A grammar-based drug-target affinity prediction approach fusing gene expression information [1.2289361708127877]
薬物や標的の構造情報と化学摂動情報を統合するGramSeq-DTAを提案する。
我々の手法は、広く使われているDTAデータセットで検証された場合、現在の最先端のDTA予測モデルよりも優れている。
論文 参考訳(メタデータ) (2024-11-03T03:17:09Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Improved Drug-target Interaction Prediction with Intermolecular Graph
Transformer [98.8319016075089]
本稿では,3方向トランスフォーマーアーキテクチャを用いて分子間情報をモデル化する手法を提案する。
分子間グラフ変換器(IGT)は、それぞれ、結合活性と結合ポーズ予測の2番目のベストに対して、最先端のアプローチを9.1%と20.5%で上回っている。
IGTはSARS-CoV-2に対して有望な薬物スクリーニング能力を示す。
論文 参考訳(メタデータ) (2021-10-14T13:28:02Z) - Relational graph convolutional networks for predicting blood-brain
barrier penetration of drug molecules [12.041672273431994]
薬物分子のBBB透過能の評価は、脳薬物開発における重要なステップである。
関連グラフ畳み込みネットワーク(RGCN)を用いて,各薬剤の特徴だけでなく,薬物とタンパク質の関係も扱う。
この性能はすでに有望であり、BBB透過性の予測において、薬物-タンパク質/ドラッグ関係が重要な役割を担っていることを証明した。
論文 参考訳(メタデータ) (2021-07-04T15:56:02Z) - Ensemble Transfer Learning for the Prediction of Anti-Cancer Drug
Response [49.86828302591469]
本稿では,抗がん剤感受性の予測にトランスファーラーニングを適用した。
我々は、ソースデータセット上で予測モデルをトレーニングし、ターゲットデータセット上でそれを洗練する古典的な転送学習フレームワークを適用した。
アンサンブル転送学習パイプラインは、LightGBMと異なるアーキテクチャを持つ2つのディープニューラルネットワーク(DNN)モデルを使用して実装されている。
論文 参考訳(メタデータ) (2020-05-13T20:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。