論文の概要: GeoRecon: Graph-Level Representation Learning for 3D Molecules via Reconstruction-Based Pretraining
- arxiv url: http://arxiv.org/abs/2506.13174v1
- Date: Mon, 16 Jun 2025 07:35:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:47.692498
- Title: GeoRecon: Graph-Level Representation Learning for 3D Molecules via Reconstruction-Based Pretraining
- Title(参考訳): GeoRecon:再構成による3次元分子のグラフレベル表現学習
- Authors: Shaoheng Yan, Zian Li, Muhan Zhang,
- Abstract要約: 分子表現学習のためのグラフレベルの事前学習フレームワークGeoReconを提案する。
事前学習中、モデルは、分子幾何学の再構築を正確に導くことができるグラフ表現を生成するように訓練される。
GeoReconは、ノード中心のベースラインを複数の分子ベンチマークで上回る。
- 参考スコア(独自算出の注目度): 19.398985037052224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The pretraining-and-finetuning paradigm has driven significant advances across domains, such as natural language processing and computer vision, with representative pretraining paradigms such as masked language modeling and next-token prediction. However, in molecular representation learning, the task design remains largely limited to node-level denoising, which is effective at modeling local atomic environments, yet maybe insufficient for capturing the global molecular structure required by graph-level property prediction tasks, such as energy estimation and molecular regression. In this work, we present GeoRecon, a novel graph-level pretraining framework that shifts the focus from individual atoms to the molecule as an integrated whole. GeoRecon introduces a graph-level reconstruction task: during pretraining, the model is trained to generate an informative graph representation capable of accurately guiding reconstruction of the molecular geometry. This encourages the model to learn coherent, global structural features rather than isolated atomic details. Without relying on additional supervision or external data, GeoRecon outperforms node-centric baselines on multiple molecular benchmarks (e.g., QM9, MD17), demonstrating the benefit of incorporating graph-level reconstruction for learning more holistic and geometry-aware molecular embeddings.
- Abstract(参考訳): 事前学習と微調整のパラダイムは、自然言語処理やコンピュータビジョンといった領域間で大きな進歩をもたらしており、マスク付き言語モデリングや次世代の予測といった代表的な事前学習パラダイムが採用されている。
しかし、分子表現学習においては、タスク設計は局所的な原子環境をモデル化するのに有効であるが、エネルギー推定や分子回帰といったグラフレベルの特性予測タスクで必要とされる大域的な分子構造を捉えるには不十分であるノードレベルの認知に限られている。
本研究では、個々の原子から分子への集中を総合的にシフトさせる新しいグラフレベルの事前学習フレームワークであるGeoReconを紹介する。
GeoReconは、事前学習中に、分子幾何学の再構築を正確に導くことができる情報グラフ表現を生成するように訓練されている。
これにより、モデルは孤立した原子の詳細ではなく、コヒーレントでグローバルな構造的特徴を学ぶことが奨励される。
追加の監視や外部データに頼ることなく、GeoReconは複数の分子ベンチマーク(例えば、QM9、MD17)でノード中心のベースラインを上回り、グラフレベルの再構成を組み込むことにより、より包括的で幾何学的な分子埋め込みを学習する利点を示す。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Pushing the Limits of All-Atom Geometric Graph Neural Networks: Pre-Training, Scaling and Zero-Shot Transfer [15.302727191576784]
全原子情報を持つ幾何学グラフニューラルネットワーク(Geom-GNN)は、原子論シミュレーションを変換した。
本研究では,Geom-GNNの自己教師付き事前学習,教師付き学習,教師なし学習環境におけるスケーリング行動について検討する。
我々は、全ての原子グラフの埋め込みが他の神経アーキテクチャと有機的に組み合わされ、表現力を高めることができることを示す。
論文 参考訳(メタデータ) (2024-10-29T03:07:33Z) - Using pretrained graph neural networks with token mixers as geometric featurizers for conformational dynamics [0.0]
我々はGeom2vecを導入し、トレーニング済みグラフニューラルネットワーク(GNN)を普遍的な幾何演算器として利用する。
学習したGNN表現は,表現型トークンミキサーと組み合わせることで,構造単位(トークン)間の解釈可能な関係を捉えることができることを示す。
論文 参考訳(メタデータ) (2024-09-30T00:36:06Z) - Hi-GMAE: Hierarchical Graph Masked Autoencoders [90.30572554544385]
階層型グラフマスク付きオートエンコーダ(Hi-GMAE)
Hi-GMAEは、グラフ内の階層構造を扱うために設計された、新しいマルチスケールGMAEフレームワークである。
15のグラフデータセットに対する実験は、Hi-GMAEが17の最先端の自己管理競合より優れていることを一貫して示している。
論文 参考訳(メタデータ) (2024-05-17T09:08:37Z) - CTAGE: Curvature-Based Topology-Aware Graph Embedding for Learning
Molecular Representations [11.12640831521393]
分子グラフデータから構造的洞察を抽出するために,$k$hopの離散リッチ曲率を用いたCTAGEの埋め込み手法を提案する。
その結果,ノード曲率の導入は,現在のグラフニューラルネットワークフレームワークの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-07-25T06:13:01Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Molecular Graph Generation via Geometric Scattering [7.796917261490019]
グラフニューラルネットワーク(GNN)は、薬物の設計と発見の問題を解決するために広く使われている。
分子グラフ生成における表現第一のアプローチを提案する。
我々のアーキテクチャは、医薬品のデータセットの有意義な表現を学習し、目標指向の薬物合成のためのプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-10-12T18:00:23Z) - GeomGCL: Geometric Graph Contrastive Learning for Molecular Property
Prediction [47.70253904390288]
本研究では2次元および3次元ビューにまたがる分子の幾何を利用した新しいグラフコントラスト学習法を提案する。
具体的には、分子の2次元グラフと3次元グラフの両方のリッチな情報を適応的に活用するために、2次元幾何学的メッセージパッシングネットワーク(GeomMPNN)を考案する。
論文 参考訳(メタデータ) (2021-09-24T03:55:27Z) - GeoMol: Torsional Geometric Generation of Molecular 3D Conformer
Ensembles [60.12186997181117]
分子グラフからの分子の3Dコンホメーラーアンサンブルの予測は、化学情報学と薬物発見の領域において重要な役割を担っている。
既存の生成モデルは、重要な分子幾何学的要素のモデリングの欠如を含むいくつかの欠点がある。
エンド・ツー・エンド、非自己回帰、SE(3)不変の機械学習手法であるGeoMolを提案し、3Dコンバータを生成する。
論文 参考訳(メタデータ) (2021-06-08T14:17:59Z) - Uncovering the Folding Landscape of RNA Secondary Structure with Deep
Graph Embeddings [71.20283285671461]
このようなグラフ埋め込みを学習するための幾何散乱オートエンコーダ(GSAE)ネットワークを提案する。
我々の埋め込みネットワークは、最近提案された幾何散乱変換を用いて、まずリッチグラフ特徴を抽出する。
GSAEは、構造とエネルギーの両方でRNAグラフを整理し、ビスタブルRNA構造を正確に反映していることを示す。
論文 参考訳(メタデータ) (2020-06-12T00:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。