Fugu-MT 論文翻訳(概要): Benchmarking GNN Models on Molecular Regression Tasks with CKA-Based Representation Analysis

論文の概要: Benchmarking GNN Models on Molecular Regression Tasks with CKA-Based Representation Analysis

arxiv url: http://arxiv.org/abs/2602.20573v1
Date: Tue, 24 Feb 2026 05:53:24 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 17:34:53.621616
Title: Benchmarking GNN Models on Molecular Regression Tasks with CKA-Based Representation Analysis
Title（参考訳）: CKA表現解析を用いた分子回帰課題におけるGNNモデルのベンチマーク
Authors: Rajan, Ishaan Gupta,
Abstract要約: 分子は一般にSMILES文字列として表現され、固定サイズの分子指紋に容易に変換できる。これらの指紋は、分子特性予測タスクのためのML/DLモデルを訓練するための特徴ベクトルとして機能する。 GNNは、固定サイズの指紋に依存するのではなく、分子内の固有の構造的関係を学習する。
参考スコア（独自算出の注目度）: 0.8594140167290097
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Molecules are commonly represented as SMILES strings, which can be readily converted to fixed-size molecular fingerprints. These fingerprints serve as feature vectors to train ML/DL models for molecular property prediction tasks in the field of computational chemistry, drug discovery, biochemistry, and materials science. Recent research has demonstrated that SMILES can be used to construct molecular graphs where atoms are nodes ($V$) and bonds are edges ($E$). These graphs can subsequently be used to train geometric DL models like GNN. GNN learns the inherent structural relationships within a molecule rather than depending on fixed-size fingerprints. Although GNN are powerful aggregators, their efficacy on smaller datasets and inductive biases across different architectures is less studied. In our present study, we performed a systematic benchmarking of four different GNN architectures across a diverse domain of datasets (physical chemistry, biological, and analytical). Additionally, we have also implemented a hierarchical fusion (GNN+FP) framework for target prediction. We observed that the fusion framework consistently outperforms or matches the performance of standalone GNN (RMSE improvement > $7\%$) and baseline models. Further, we investigated the representational similarity using centered kernel alignment (CKA) between GNN and fingerprint embeddings and found that they occupy highly independent latent spaces (CKA $\le0.46$). The cross-architectural CKA score suggests a high convergence between isotopic models like GCN, GraphSAGE and GIN (CKA $\geq0.88$), with GAT learning moderately independent representation (CKA $0.55-0.80$).
Abstract（参考訳）: 分子は一般にSMILES文字列として表現され、固定サイズの分子指紋に容易に変換できる。これらの指紋は、計算化学、薬物発見、生化学、材料科学の分野における分子特性予測タスクのためのML/DLモデルを訓練するための特徴ベクトルとして機能する。最近の研究では、SMILESは原子がノード(V$)で結合がエッジ(E$)である分子グラフを構築するのに使えることが示されている。これらのグラフはその後、GNNのような幾何学的DLモデルのトレーニングに使用することができる。 GNNは、固定サイズの指紋に依存するのではなく、分子内の固有の構造的関係を学習する。 GNNは強力なアグリゲータであるが、より小さなデータセットと異なるアーキテクチャにわたる帰納的バイアスに対する効果はあまり研究されていない。本研究では,4つの異なるGNNアーキテクチャを,様々なデータセット(物理化学,生物,分析)の領域にわたって,系統的なベンチマークを行った。さらに,ターゲット予測のための階層型融合(GNN+FP)フレームワークも実装した。融合フレームワークはスタンドアロンのGNN(RMSEの改善)とベースラインモデルのパフォーマンスを一貫して上回るか、あるいは一致している。さらに,GNNと指紋の埋め込みにおける中心核アライメント(CKA)を用いた表現的類似性について検討し,高い独立性を有する潜伏空間(CKA $\le0.46$)を占有していることを見出した。クロスアーキテクチャCKAスコアは、GCN、GraphSAGE、GIN(CKA $\geq0.88$)のような同位体モデルと、GAT学習の適度な独立表現(CKA $0.55-0.80$)との間に高い収束性を示唆している。

関連論文リスト

Geometric Multi-color Message Passing Graph Neural Networks for Blood-brain Barrier Permeability Prediction [1.488392495573075]
本稿では,幾何学的多色メッセージパッシンググラフニューラルネットワーク(GMC-MPNN)を提案する。本モデルは,血液脳関門透過性を規定する空間的関係と化学的文脈を捉えるために,原子タイプに基づく重み付きカラーサブグラフを構築した。
論文参考訳（メタデータ） (2025-07-25T03:38:46Z)
Generalization of Graph Neural Networks is Robust to Model Mismatch [84.01980526069075]
グラフニューラルネットワーク(GNN)は、その一般化能力によってサポートされている様々なタスクにおいて、その効果を実証している。本稿では,多様体モデルから生成される幾何グラフで動作するGNNについて検討する。本稿では,そのようなモデルミスマッチの存在下でのGNN一般化の堅牢性を明らかにする。
論文参考訳（メタデータ） (2024-08-25T16:00:44Z)
Molecular Hypergraph Neural Networks [1.4559839293730863]
グラフニューラルネットワーク(GNN)は、様々な化学関連タスクで有望なパフォーマンスを示している。分子ハイパーグラフを導入し、有機半導体の光電子特性を予測する分子ハイパーグラフニューラルネットワーク(MHNN)を提案する。 MHNNは、OPV、OCELOTv1、PCQM4Mv2データセットのほとんどのタスクにおけるベースラインモデルよりも優れている。
論文参考訳（メタデータ） (2023-12-20T15:56:40Z)
Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文参考訳（メタデータ） (2023-06-02T15:49:45Z)
GCNH: A Simple Method For Representation Learning On Heterophilous Graphs [4.051099980410583]
グラフニューラルネットワーク(GNN)は、ホモフィルグラフの学習に適している。近年,異種グラフの性能向上を目的とした標準GNNアーキテクチャの拡張が提案されている。ヘテロフィリィ(GCNH)のためのGCNを提案し,ヘテロフィリィシナリオとホモフィリィシナリオの両方に適用できる簡易かつ効果的なGNNアーキテクチャを提案する。
論文参考訳（メタデータ） (2023-04-21T11:26:24Z)
MolGraph: a Python package for the implementation of molecular graphs and graph neural networks with TensorFlow and Keras [51.92255321684027]
MolGraphは、分子機械学習(ML)のためのグラフニューラルネットワーク(GNN)パッケージである MolGraphは、分子ML問題を解決するためにGNNアルゴリズムに渡すことができる小さな分子グラフを生成するための化学モジュールを実装している。 GNNは分子識別に有用であり,クロマトグラフィー保持時間データの解釈性が向上した。
論文参考訳（メタデータ） (2022-08-21T18:37:41Z)
Graph neural networks for the prediction of molecular structure-property relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。 GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文参考訳（メタデータ） (2022-07-25T11:30:44Z)
MGNN: Graph Neural Networks Inspired by Distance Geometry Problem [28.789684784093048]
グラフニューラルネットワーク(GNN)は、機械学習分野における顕著な研究トピックとして現れている。本稿では,GNNの分類段階における分類器の親近性に着想を得たGNNモデルを提案する。合成および実世界の両方のデータセットを用いて実験を行い,本モデルの有効性を広範囲に評価した。
論文参考訳（メタデータ） (2022-01-31T04:15:42Z)
$p$-Laplacian Based Graph Neural Networks [27.747195341003263]
グラフネットワーク(GNN)は、グラフ上の半教師付きノード分類において優れた性能を示す。我々は、離散正規化フレームワークからメッセージパッシング機構を導出する$p$GNNと呼ばれる新しい$p$LaplacianベースのGNNモデルを提案する。新たなメッセージパッシング機構は低域通過フィルタと高域通過フィルタを同時に動作させることで,ホモ親和性グラフとヘテロ親和性グラフの両方に対して$p$GNNを有効にすることができることを示す。
論文参考訳（メタデータ） (2021-11-14T13:16:28Z)
Eigen-GNN: A Graph Structure Preserving Plug-in for GNNs [95.63153473559865]
グラフニューラルネットワーク(GNN)は、グラフ上の新たな機械学習モデルである。既存のGNNモデルの多くは浅く、本質的に機能中心である。我々は,既存の浅いGNNがグラフ構造をよく保存できないことを経験的かつ解析的に示す。本稿では,グラフ構造保存におけるGNNの能力を高めるプラグインモジュールであるEigen-GNNを提案する。
論文参考訳（メタデータ） (2020-06-08T02:47:38Z)
Multi-View Graph Neural Networks for Molecular Property Prediction [67.54644592806876]
マルチビューグラフニューラルネットワーク(MV-GNN)を提案する。 MV-GNNでは,学習過程を安定させるために,自己注意型読み出しコンポーネントと不一致損失を導入する。我々は、相互依存型メッセージパッシング方式を提案することにより、MV-GNNの表現力をさらに強化する。
論文参考訳（メタデータ） (2020-05-17T04:46:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。