論文の概要: Multi-level Self-supervised Pretraining on Compositional Hierarchical Graph for Molecular Property Prediction
- arxiv url: http://arxiv.org/abs/2605.16088v1
- Date: Fri, 15 May 2026 15:47:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.347748
- Title: Multi-level Self-supervised Pretraining on Compositional Hierarchical Graph for Molecular Property Prediction
- Title(参考訳): 分子特性予測のための構成階層グラフによる多段階自己教師付き事前学習
- Authors: Xiayu Liu, Zhengyi Lu, Hou-biao Li,
- Abstract要約: MolCHGは、新しい構成階層グラフ上に構築された多層自己教師型事前学習フレームワークである。
我々のアーキテクチャは、独立に進化するノード表現に結合レベル情報を高める。
9つのMoleculeNetベンチマークの実験では、7つのデータセットでMoleculeGが最高のパフォーマンスを達成している。
- 参考スコア(独自算出の注目度): 0.5097809301149341
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised pretraining on molecular graphs has emerged as a promising approach for molecular property prediction, yet most existing methods operate at a single structural granularity and treat bond information as auxiliary edge attributes rather than as an independent semantic layer. In this work, we propose MolCHG, a multi-level self-supervised pretraining framework built upon a novel Compositional Hierarchical Graph that organizes molecular structure into four types of nodes across three semantic levels. By introducing a bond graph that operates in parallel with the atom graph, our architecture elevates bond-level information to independently evolving node representations, enabling fragment nodes to aggregate atom-level and bond-level semantics on an equal footing. We design three level-specific pretraining objectives: an atom-bond cross-view contrastive task that aligns the atom-view and bond-view representations within each fragment, a fragment-level functional group prediction task to inject domain-relevant chemical knowledge, and graph-level structure prediction tasks to encode global molecular topology. Experiments on nine MoleculeNet benchmarks demonstrate that MolCHG achieves the best performance on seven datasets across both classification and regression tasks, remaining competitive with the strongest baselines on the rest. Ablation studies further confirm that the multi-level supervision signals are complementary and that each component contributes to the overall performance.
- Abstract(参考訳): 分子グラフ上での自己教師付き事前学習は分子特性予測の有望なアプローチとして現れているが、既存のほとんどの手法は単一の構造的粒度で動作し、結合情報を独立した意味層としてではなく補助的なエッジ属性として扱う。
本研究では,分子構造を3つの意味レベルにまたがる4種類のノードにまとめる新しい構成階層グラフ上に構築された,多層自己教師型事前学習フレームワークであるMolCHGを提案する。
原子グラフと平行に動作する結合グラフを導入することで、我々のアーキテクチャは、結合レベル情報を独立に進化するノード表現に高め、断片ノードが等しい足場上で原子レベルおよび結合レベルセマンティクスを集約することを可能にする。
我々は,各フラグメント内の原子ビューと結合ビューの表現を整列する原子ボンド・クロスビューコントラストタスク,ドメイン関連化学知識を注入するフラグメントレベル機能グループ予測タスク,グローバル分子トポロジーを符号化するグラフレベル構造予測タスクの3つのレベル固有の事前学習目標を設計する。
9つのMoleculeNetベンチマークの実験では、MolCHGは分類タスクと回帰タスクの両方で7つのデータセット上で最高のパフォーマンスを達成しており、残りは最強のベースラインと競合する。
アブレーション研究により、多レベル監視信号は相補的であり、各成分が全体的な性能に寄与することを確認する。
関連論文リスト
- Beyond the Academic Monoculture: A Unified Framework and Industrial Perspective for Attributed Graph Clustering [75.50670592447219]
分散グラフクラスタリング(AGC)は、構造トポロジとノード属性を共同でモデル化することによって、ノードを凝集性グループに分割する基本的な教師なしタスクである。
この調査は、3つの相補的な視点からAGCを包括的かつ工業的に基礎づけたレビューを提供する。
論文 参考訳(メタデータ) (2026-03-21T14:15:34Z) - Hierarchical Molecular Representation Learning via Fragment-Based Self-Supervised Embedding Prediction [7.459632891054827]
グラフ自己教師型学習(GSSL)は、人間のアノテーションを必要とせず、表現力のあるグラフ埋め込みを生成する強力な可能性を示している。
GraSPNetは階層的な自己管理フレームワークで、原子レベルのセマンティクスとフラグメントレベルのセマンティクスの両方を明示的にモデル化する。
GraSPNetは化学的に意味のある表現を学習し、トランスファーラーニング設定において最先端のGSSLメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-23T20:41:44Z) - ProtoMol: Enhancing Molecular Property Prediction via Prototype-Guided Multimodal Learning [14.289447310645878]
ProtoMolは、モダリティ間のきめ細かい統合と一貫性のあるセマンティックアライメントを可能にするプロトタイプガイドフレームワークである。
ProtoMolは、さまざまな分子特性予測タスクにおいて、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-10-19T13:19:37Z) - GeoRecon: Graph-Level Representation Learning for 3D Molecules via Reconstruction-Based Pretraining [34.23512730854597]
グラフレベルの事前学習フレームワークであるGeoReconを紹介する。
GeoReconは、より滑らかで移動可能な潜在空間を誘導しながら、幾何再構成をガイドするグラフレベルの再構築タスクを定式化する。
外部の監視を頼らずに、GeoReconは一般的に、複数の分子ベンチマークのバックボーンベースラインを改善している。
論文 参考訳(メタデータ) (2025-06-16T07:35:49Z) - Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation [42.08917809689811]
クロスモーダル表現学習は、分子表現の質を高めるための有望な方向として登場した。
SMILES文字列とテキストから表現を共同で学習する階層的分子表現学習フレームワークAtomasを提案する。
Atomasは11のデータセット上の12のタスクで優れたパフォーマンスを実現し、11のベースラインモデルを上回っている。
論文 参考訳(メタデータ) (2024-04-23T12:35:44Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Self-supervised Graph-level Representation Learning with Local and
Global Structure [71.45196938842608]
自己教師付き全グラフ表現学習のためのローカル・インスタンスとグローバル・セマンティック・ラーニング(GraphLoG)という統合フレームワークを提案する。
GraphLoGは、局所的な類似点の保存に加えて、グローバルなセマンティッククラスタをキャプチャする階層的なプロトタイプも導入している。
モデル学習のための効率的なオンライン予測最大化(EM)アルゴリズムがさらに開発された。
論文 参考訳(メタデータ) (2021-06-08T05:25:38Z) - Distance-aware Molecule Graph Attention Network for Drug-Target Binding
Affinity Prediction [54.93890176891602]
薬物標的結合親和性予測に適したDiStance-aware Molecule graph Attention Network (S-MAN)を提案する。
そこで,我々はまず,構築したポケットリガンドグラフに位相構造と空間位置情報を統合する位置符号化機構を提案する。
また,エッジレベルアグリゲーションとノードレベルアグリゲーションを有するエッジノード階層的アグリゲーション構造を提案する。
論文 参考訳(メタデータ) (2020-12-17T17:44:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。