論文の概要: On Improving Graph Neural Networks for QSAR by Pre-training on Extended-Connectivity Fingerprints
- arxiv url: http://arxiv.org/abs/2605.10722v1
- Date: Mon, 11 May 2026 15:30:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 02:24:05.577974
- Title: On Improving Graph Neural Networks for QSAR by Pre-training on Extended-Connectivity Fingerprints
- Title(参考訳): 拡張コネクティビティ指紋の事前学習によるQSAR用グラフニューラルネットワークの改良について
- Authors: Sam Money-Kyrle, Markus Dablander, Thierry Hanser, Stephane Werner, Charlotte M. Deane, Garrett M. Morris,
- Abstract要約: 本稿では,QSARのGNNを事前学習して拡張接続フィンガープリントを予測するための一般的な戦略について報告する。
ECFP事前学習GNNを用いた場合, 評価ベースライン全体の標準性能指標の統計的に有意な改善が見られた。
よりヘテロジニアスなデータセットと、バインディング親和性予測のようなより複雑なエンドポイントでは、OOD設定では未処理のトレーニング済みのGNNが実行されます。
- 参考スコア(独自算出の注目度): 2.551259788071467
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular Graph Neural Networks (GNNs) are increasingly common in drug discovery, particularly for Quantitative Structure-Activity Relationship (QSAR) studies; yet, their superiority compared to classical molecular featurisation approaches is disputed. We report a general strategy for improving GNNs for QSAR by pre-training to predict Extended-Connectivity Fingerprints (ECFP). We validate our approach with statistical tests and challenging out-of-distribution (OOD) splits. Across five out of six Biogen benchmarks, we observed a statistically significant improvement in standard performance metrics over all evaluated baselines when using ECFP pre-trained GNNs. However, for more heterogeneous datasets and more complex endpoints, such as binding affinity prediction, pre-trained GNNs underperformed in OOD settings. Importantly, we investigated the impact of substructure-level data leakage during pre-training on downstream performance. While we identified scenarios where pre-training on ECFPs was less effective, our findings show that ECFP-based pre-training can enhance downstream OOD performance on a diverse set of practically relevant QSAR tasks.
- Abstract(参考訳): 分子グラフニューラルネットワーク(GNN)は、特にQSAR(Quantical Structure-Activity Relation)研究において、薬物発見においてますます一般的になっている。
本稿では,拡張接続指紋(ECFP)の事前学習により,QSARのGNNを改善するための一般的な戦略について報告する。
本研究は,統計検査によるアプローチの検証と,アウト・オブ・ディストリビューション(OOD)の分割に挑戦する。
6つのBiogenベンチマークのうち5つで、ECFP事前学習GNNを用いた場合、評価ベースライン全体の標準性能指標が統計的に有意な改善を示した。
しかし、結合親和性予測のようなより異質なデータセットやより複雑なエンドポイントでは、事前訓練されたGNNはOOD設定では不十分である。
重要なこととして,前訓練時のサブ構造レベルのデータ漏洩が下流性能に及ぼす影響について検討した。
ECFPの事前学習がより効果的でないシナリオを特定できたが,本研究では,ECFPをベースとした事前学習が,多種多様なQSARタスクにおいて,下流のOOD性能を向上させることが示唆された。
関連論文リスト
- SCL-GNN: Towards Generalizable Graph Neural Networks via Spurious Correlation Learning [12.004932896426347]
グラフニューラルネットワーク(GNN)は、さまざまなタスクで顕著な成功を収めている。
GNNは、たとえそのような相関が予測に信頼できないとしても、トレーニングデータにおいて受容不能な統計的相関を利用する傾向がある。
本稿では,独立分散(IID)グラフとアウト・オブ・ディストリビューション(OOD)グラフの両方を一般化するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-09T11:42:06Z) - Takeuchi's Information Criteria as Generalization Measures for DNNs Close to NTK Regime [56.89793618576349]
一般化のギャップをよりよく特徴付けるため、機械学習コミュニティにおいて一般化対策が広く研究されている。
本研究では,この古典的尺度が深層ニューラルネットワーク(DNN)の一般化ギャップを効果的に説明できる条件を明らかにするために,竹内の情報基準(TIC)に着目した。
論文 参考訳(メタデータ) (2026-02-26T17:01:14Z) - Augmented data and neural networks for robust epidemic forecasting: application to COVID-19 in Italy [0.2676349883103403]
本稿では,ニューラルネットワークのトレーニングフェーズの改善を目的としたデータ拡張戦略を提案する。
提案手法は,不確実性の組み合わさった適切な構成モデルによる合成データの生成に依存している。
その結果、これらの拡張データセットに基づいてトレーニングされたニューラルネットワークは、予測性能を著しく改善していることがわかった。
論文 参考訳(メタデータ) (2025-10-10T09:35:38Z) - Evidential Uncertainty Probes for Graph Neural Networks [3.5169632430086315]
グラフニューラルネットワーク(GNN)における不確実性定量化のためのプラグアンドプレイフレームワークを提案する。
Evidential Probing Network (EPN) は、学習した表現から証拠を抽出するために軽量なMulti-Layer-Perceptron (MLP) ヘッドを使用する。
EPN-regは、正確で効率的な不確実性定量化において最先端のパフォーマンスを実現し、現実世界のデプロイメントに適している。
論文 参考訳(メタデータ) (2025-03-11T07:00:54Z) - DeepHGNN: Study of Graph Neural Network based Forecasting Methods for Hierarchically Related Multivariate Time Series [5.029860184826624]
本稿では,複雑な階層構造における予測を目的とした新しい階層型GNN(DeepHGNN)フレームワークを提案する。
DeepHGNNは、様々な階層レベルの予測精度とコヒーレンスを保証し、それらをまたいだ信号を共有する。
複数の最先端モデルに対する包括的評価セットにより,DeepHGNNの優れた性能が確認された。
論文 参考訳(メタデータ) (2024-05-29T02:06:17Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Does GNN Pretraining Help Molecular Representation? [5.5459878275267736]
自己教師付きグラフ事前学習は、多くの設定において非事前学習法に対して統計的に有意な優位性を持たない。
追加の教師付き事前トレーニングでは改善が観察できるが、よりリッチな機能やバランスの取れたデータ分割によって改善は減少する可能性がある。
我々は、分子の事前学習の複雑さが不十分であり、下流のタスクに対する伝達可能な知識が少なくなると仮定する。
論文 参考訳(メタデータ) (2022-07-13T07:34:16Z) - Generalizing Graph Neural Networks on Out-Of-Distribution Graphs [51.33152272781324]
トレーニンググラフとテストグラフの分散シフトを考慮せずにグラフニューラルネットワーク(GNN)を提案する。
このような環境では、GNNは、たとえ素早い相関であるとしても、予測のためのトレーニングセットに存在する微妙な統計的相関を利用する傾向がある。
本稿では,スプリアス相関の影響を排除するため,StableGNNと呼ばれる一般的な因果表現フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-20T18:57:18Z) - Predicting Deep Neural Network Generalization with Perturbation Response
Curves [58.8755389068888]
トレーニングネットワークの一般化能力を評価するための新しいフレームワークを提案する。
具体的には,一般化ギャップを正確に予測するための2つの新しい尺度を提案する。
PGDL(Predicting Generalization in Deep Learning)のNeurIPS 2020コンペティションにおけるタスクの大部分について、現在の最先端の指標よりも優れた予測スコアを得る。
論文 参考訳(メタデータ) (2021-06-09T01:37:36Z) - Bayesian Graph Neural Networks with Adaptive Connection Sampling [62.51689735630133]
グラフニューラルネットワーク(GNN)における適応接続サンプリングのための統一的なフレームワークを提案する。
提案フレームワークは,深部GNNの過度なスムース化や過度に適合する傾向を緩和するだけでなく,グラフ解析タスクにおけるGNNによる不確実性の学習を可能にする。
論文 参考訳(メタデータ) (2020-06-07T07:06:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。