論文の概要: Benchmarking GNN Models on Molecular Regression Tasks with CKA-Based Representation Analysis
- arxiv url: http://arxiv.org/abs/2602.20573v1
- Date: Tue, 24 Feb 2026 05:53:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.621616
- Title: Benchmarking GNN Models on Molecular Regression Tasks with CKA-Based Representation Analysis
- Title(参考訳): CKA表現解析を用いた分子回帰課題におけるGNNモデルのベンチマーク
- Authors: Rajan, Ishaan Gupta,
- Abstract要約: 分子は一般にSMILES文字列として表現され、固定サイズの分子指紋に容易に変換できる。
これらの指紋は、分子特性予測タスクのためのML/DLモデルを訓練するための特徴ベクトルとして機能する。
GNNは、固定サイズの指紋に依存するのではなく、分子内の固有の構造的関係を学習する。
- 参考スコア(独自算出の注目度): 0.8594140167290097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecules are commonly represented as SMILES strings, which can be readily converted to fixed-size molecular fingerprints. These fingerprints serve as feature vectors to train ML/DL models for molecular property prediction tasks in the field of computational chemistry, drug discovery, biochemistry, and materials science. Recent research has demonstrated that SMILES can be used to construct molecular graphs where atoms are nodes ($V$) and bonds are edges ($E$). These graphs can subsequently be used to train geometric DL models like GNN. GNN learns the inherent structural relationships within a molecule rather than depending on fixed-size fingerprints. Although GNN are powerful aggregators, their efficacy on smaller datasets and inductive biases across different architectures is less studied. In our present study, we performed a systematic benchmarking of four different GNN architectures across a diverse domain of datasets (physical chemistry, biological, and analytical). Additionally, we have also implemented a hierarchical fusion (GNN+FP) framework for target prediction. We observed that the fusion framework consistently outperforms or matches the performance of standalone GNN (RMSE improvement > $7\%$) and baseline models. Further, we investigated the representational similarity using centered kernel alignment (CKA) between GNN and fingerprint embeddings and found that they occupy highly independent latent spaces (CKA $\le0.46$). The cross-architectural CKA score suggests a high convergence between isotopic models like GCN, GraphSAGE and GIN (CKA $\geq0.88$), with GAT learning moderately independent representation (CKA $0.55-0.80$).
- Abstract(参考訳): 分子は一般にSMILES文字列として表現され、固定サイズの分子指紋に容易に変換できる。
これらの指紋は、計算化学、薬物発見、生化学、材料科学の分野における分子特性予測タスクのためのML/DLモデルを訓練するための特徴ベクトルとして機能する。
最近の研究では、SMILESは原子がノード(V$)で結合がエッジ(E$)である分子グラフを構築するのに使えることが示されている。
これらのグラフはその後、GNNのような幾何学的DLモデルのトレーニングに使用することができる。
GNNは、固定サイズの指紋に依存するのではなく、分子内の固有の構造的関係を学習する。
GNNは強力なアグリゲータであるが、より小さなデータセットと異なるアーキテクチャにわたる帰納的バイアスに対する効果はあまり研究されていない。
本研究では,4つの異なるGNNアーキテクチャを,様々なデータセット(物理化学,生物,分析)の領域にわたって,系統的なベンチマークを行った。
さらに,ターゲット予測のための階層型融合(GNN+FP)フレームワークも実装した。
融合フレームワークはスタンドアロンのGNN(RMSEの改善)とベースラインモデルのパフォーマンスを一貫して上回るか、あるいは一致している。
さらに,GNNと指紋の埋め込みにおける中心核アライメント(CKA)を用いた表現的類似性について検討し,高い独立性を有する潜伏空間(CKA $\le0.46$)を占有していることを見出した。
クロスアーキテクチャCKAスコアは、GCN、GraphSAGE、GIN(CKA $\geq0.88$)のような同位体モデルと、GAT学習の適度な独立表現(CKA $0.55-0.80$)との間に高い収束性を示唆している。
関連論文リスト
- Generalization of Graph Neural Networks is Robust to Model Mismatch [84.01980526069075]
グラフニューラルネットワーク(GNN)は、その一般化能力によってサポートされている様々なタスクにおいて、その効果を実証している。
本稿では,多様体モデルから生成される幾何グラフで動作するGNNについて検討する。
本稿では,そのようなモデルミスマッチの存在下でのGNN一般化の堅牢性を明らかにする。
論文 参考訳(メタデータ) (2024-08-25T16:00:44Z) - Molecular Hypergraph Neural Networks [1.4559839293730863]
グラフニューラルネットワーク(GNN)は、様々な化学関連タスクで有望なパフォーマンスを示している。
分子ハイパーグラフを導入し、有機半導体の光電子特性を予測する分子ハイパーグラフニューラルネットワーク(MHNN)を提案する。
MHNNは、OPV、OCELOTv1、PCQM4Mv2データセットのほとんどのタスクにおけるベースラインモデルよりも優れている。
論文 参考訳(メタデータ) (2023-12-20T15:56:40Z) - MolGraph: a Python package for the implementation of molecular graphs
and graph neural networks with TensorFlow and Keras [51.92255321684027]
MolGraphは、分子機械学習(ML)のためのグラフニューラルネットワーク(GNN)パッケージである
MolGraphは、分子ML問題を解決するためにGNNアルゴリズムに渡すことができる小さな分子グラフを生成するための化学モジュールを実装している。
GNNは分子識別に有用であり,クロマトグラフィー保持時間データの解釈性が向上した。
論文 参考訳(メタデータ) (2022-08-21T18:37:41Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - MGNN: Graph Neural Networks Inspired by Distance Geometry Problem [28.789684784093048]
グラフニューラルネットワーク(GNN)は、機械学習分野における顕著な研究トピックとして現れている。
本稿では,GNNの分類段階における分類器の親近性に着想を得たGNNモデルを提案する。
合成および実世界の両方のデータセットを用いて実験を行い,本モデルの有効性を広範囲に評価した。
論文 参考訳(メタデータ) (2022-01-31T04:15:42Z) - $p$-Laplacian Based Graph Neural Networks [27.747195341003263]
グラフネットワーク(GNN)は、グラフ上の半教師付きノード分類において優れた性能を示す。
我々は、離散正規化フレームワークからメッセージパッシング機構を導出する$p$GNNと呼ばれる新しい$p$LaplacianベースのGNNモデルを提案する。
新たなメッセージパッシング機構は低域通過フィルタと高域通過フィルタを同時に動作させることで,ホモ親和性グラフとヘテロ親和性グラフの両方に対して$p$GNNを有効にすることができることを示す。
論文 参考訳(メタデータ) (2021-11-14T13:16:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。