論文の概要: Dual-Axis RCCL: Representation-Complete Convergent Learning for Organic Chemical Space
- arxiv url: http://arxiv.org/abs/2512.14418v1
- Date: Tue, 16 Dec 2025 14:05:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.737051
- Title: Dual-Axis RCCL: Representation-Complete Convergent Learning for Organic Chemical Space
- Title(参考訳): Dual-Axis RCCL:有機化学空間における表現完全収束学習
- Authors: Dejun Hu, Zhiming Li, Jia-Rui Shen, Jia-Ning Tu, Zi-Hao Ye, Junliang Zhang,
- Abstract要約: 本稿では,分子表現によって実現されるRCCL(Dual-Axis Representation-Complete Convergent Learning)戦略を紹介する。
このフレームワークは表現完全性を形式化し、収束学習をサポートする原則付きデータセット構築の基礎を確立する。
この結果は,分子表現,構造的完全性,モデル一般化の定量的リンクを確立し,解釈可能,伝達可能,およびデータ効率のよい分子インテリジェンスの基礎となる。
- 参考スコア(独自算出の注目度): 5.782261680001994
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine learning is profoundly reshaping molecular and materials modeling; however, given the vast scale of chemical space (10^30-10^60), it remains an open scientific question whether models can achieve convergent learning across this space. We introduce a Dual-Axis Representation-Complete Convergent Learning (RCCL) strategy, enabled by a molecular representation that integrates graph convolutional network (GCN) encoding of local valence environments, grounded in modern valence bond theory, together with no-bridge graph (NBG) encoding of ring/cage topologies, providing a quantitative measure of chemical-space coverage. This framework formalizes representation completeness, establishing a principled basis for constructing datasets that support convergent learning for large models. Guided by this RCCL framework, we develop the FD25 dataset, systematically covering 13,302 local valence units and 165,726 ring/cage topologies, achieving near-complete combinatorial coverage of organic molecules with H/C/N/O/F elements. Graph neural networks trained on FD25 exhibit representation-complete convergent learning and strong out-of-distribution generalization, with an overall prediction error of approximately 1.0 kcal/mol MAE across external benchmarks. Our results establish a quantitative link between molecular representation, structural completeness, and model generalization, providing a foundation for interpretable, transferable, and data-efficient molecular intelligence.
- Abstract(参考訳): 機械学習は分子と材料モデリングを根本的に変えつつあるが、化学空間(10^30-10^60)の膨大な規模を考えると、モデルがこの領域をまたいで収束学習を達成できるかどうかという科学的な疑問が残る。
本稿では,局所原子価結合理論に基づく局所原子価環境のグラフ畳み込みネットワーク(GCN)エンコーディングと,リング/ケージトポロジーのノーブリッジグラフ(NBG)エンコーディングを統合した分子的表現によって実現されたRCCL(Dual-Axis Representation-Complete Convergent Learning)戦略を紹介する。
このフレームワークは表現完全性を形式化し、大規模モデルの収束学習をサポートするデータセットを構築するための原則的基盤を確立する。
このRCCLフレームワークを用いて,13,302個の局所原子価単位と165,726個の環/ケージトポロジーを体系的にカバーし,H/C/N/O/F元素による有機分子のほぼ完全な結合被覆を実現するFD25データセットを開発した。
FD25でトレーニングされたグラフニューラルネットワークは、表現完全収束学習と強力な分布の一般化を示し、全体的な予測誤差は外部ベンチマークで約1.0 kcal/mol MAEである。
この結果は,分子表現,構造的完全性,モデル一般化の定量的リンクを確立し,解釈可能,伝達可能,およびデータ効率のよい分子インテリジェンスの基礎となる。
関連論文リスト
- Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。
分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。
細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文 参考訳(メタデータ) (2025-07-22T04:35:50Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。
分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。
異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文 参考訳(メタデータ) (2023-06-02T15:49:45Z) - Learning Harmonic Molecular Representations on Riemannian Manifold [18.49126496517951]
分子表現学習は、AIによる薬物発見研究において重要な役割を担っている。
本研究では,その分子表面のラプラス・ベルトラミ固有関数を用いた分子を表現する高調波分子表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-27T18:02:47Z) - ChemRL-GEM: Geometry Enhanced Molecular Representation Learning for
Property Prediction [25.49976851499949]
化学表現学習のための新しい幾何強化分子表現学習法(GEM)を提案する。
まず、分子内の原子、結合、結合角を同時にモデル化する幾何学に基づくGNNアーキテクチャを設計する。
考案されたGNNアーキテクチャの上に,空間知識を学習するための幾何レベルの自己教師型学習戦略を提案する。
論文 参考訳(メタデータ) (2021-06-11T02:35:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。