論文の概要: Hierarchical Grammar-Induced Geometry for Data-Efficient Molecular
Property Prediction
- arxiv url: http://arxiv.org/abs/2309.01788v1
- Date: Mon, 4 Sep 2023 19:59:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 17:22:26.980486
- Title: Hierarchical Grammar-Induced Geometry for Data-Efficient Molecular
Property Prediction
- Title(参考訳): データ効率の高い分子特性予測のための階層的文法誘導幾何
- Authors: Minghao Guo, Veronika Thost, Samuel W Song, Adithya Balachandran,
Payel Das, Jie Chen, Wojciech Matusik
- Abstract要約: 学習可能な階層型分子文法を用いたデータ効率特性予測器を提案する。
特性予測は文法誘発幾何上のグラフニューラル拡散を用いて行われる。
極めて限られたデータを持つ場合に有効性を示す、詳細なアブレーション研究とソリューションのさらなる分析を含む。
- 参考スコア(独自算出の注目度): 37.443491843178315
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The prediction of molecular properties is a crucial task in the field of
material and drug discovery. The potential benefits of using deep learning
techniques are reflected in the wealth of recent literature. Still, these
techniques are faced with a common challenge in practice: Labeled data are
limited by the cost of manual extraction from literature and laborious
experimentation. In this work, we propose a data-efficient property predictor
by utilizing a learnable hierarchical molecular grammar that can generate
molecules from grammar production rules. Such a grammar induces an explicit
geometry of the space of molecular graphs, which provides an informative prior
on molecular structural similarity. The property prediction is performed using
graph neural diffusion over the grammar-induced geometry. On both small and
large datasets, our evaluation shows that this approach outperforms a wide
spectrum of baselines, including supervised and pre-trained graph neural
networks. We include a detailed ablation study and further analysis of our
solution, showing its effectiveness in cases with extremely limited data. Code
is available at https://github.com/gmh14/Geo-DEG.
- Abstract(参考訳): 分子特性の予測は、物質発見と薬物発見の分野で重要な課題である。
ディープラーニング技術を使うことの潜在的な利点は、近年の文学の富に反映されている。
ラベル付きデータは、文献から手動で抽出するコストと、手間のかかる実験によって制限されます。
本研究では, 学習可能な階層型分子文法を用いて, 文法生成規則から分子を生成可能なデータ効率特性予測器を提案する。
このような文法は、分子グラフの空間の明示的な幾何学を誘導し、分子構造類似性に先立って情報を提供する。
文法誘起幾何上のグラフニューラルネットワーク拡散を用いて特性予測を行う。
小さいデータセットと大きなデータセットの両方において、この手法は教師付きおよび事前学習されたグラフニューラルネットワークを含む幅広いベースラインよりも優れていることを示す。
極めて限られたデータを持つ場合に有効性を示す、詳細なアブレーション研究とソリューションのさらなる分析を含む。
コードはhttps://github.com/gmh14/Geo-DEGで入手できる。
関連論文リスト
- Graph Residual based Method for Molecular Property Prediction [0.7499722271664147]
この写本は、GRUベースの新しい方法論であるECRGNNの詳細な記述を強調し、使用済みの入力をマッピングする。
変分オートエンコーダ(VAE)の詳細な記述と,マルチクラスマルチラベル特性予測に用いるエンドツーエンド学習法も提案した。
論文 参考訳(メタデータ) (2024-07-27T09:01:36Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Extreme Acceleration of Graph Neural Network-based Prediction Models for
Quantum Chemistry [7.592530794455257]
本稿では,分子特性予測のためのグラフニューラルネットワークのトレーニングをスケールアップするための,ハードウェアとソフトウェアの共同設計手法を提案する。
本稿では,分子グラフのバッチを固定サイズパックに結合して冗長計算やメモリを不要にするアルゴリズムを提案する。
このような共同設計手法により、分子特性予測モデルのトレーニング時間を数日から2時間未満に短縮できることを示す。
論文 参考訳(メタデータ) (2022-11-25T01:30:18Z) - Graph neural networks for the prediction of molecular structure-property
relationships [59.11160990637615]
グラフニューラルネットワーク(GNN)は、分子グラフ上で直接動作する新しい機械学習手法である。
GNNは、エンドツーエンドでプロパティを学習できるため、情報記述子の必要性を回避することができる。
本稿では、分子特性予測のための2つの例を通して、GNNの基礎を説明し、GNNの応用を実証する。
論文 参考訳(メタデータ) (2022-07-25T11:30:44Z) - Graph-in-Graph (GiG): Learning interpretable latent graphs in
non-Euclidean domain for biological and healthcare applications [52.65389473899139]
グラフは、医療領域において、非ユークリッドな非ユークリッドデータをユビキタスに表現し、分析するための強力なツールである。
近年の研究では、入力データサンプル間の関係を考慮すると、下流タスクに正の正の正則化効果があることが示されている。
タンパク質分類と脳イメージングのためのニューラルネットワークアーキテクチャであるGraph-in-Graph(GiG)を提案する。
論文 参考訳(メタデータ) (2022-04-01T10:01:37Z) - Data-Efficient Graph Grammar Learning for Molecular Generation [41.936515793383]
本稿では,一般的なベンチマークよりも小さなサイズのデータセットから学習可能な,データ効率のよい生成モデルを提案する。
学習したグラフ文法は、3つのモノマーデータセットに対して高品質な分子を生成するための最先端の結果をもたらす。
また, 本手法は, トレーニングサンプル117ドルで, 難易度の高いポリマー生成タスクにおいて, 顕著な性能を実現している。
論文 参考訳(メタデータ) (2022-03-15T16:14:30Z) - Molecular Graph Generation via Geometric Scattering [7.796917261490019]
グラフニューラルネットワーク(GNN)は、薬物の設計と発見の問題を解決するために広く使われている。
分子グラフ生成における表現第一のアプローチを提案する。
我々のアーキテクチャは、医薬品のデータセットの有意義な表現を学習し、目標指向の薬物合成のためのプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-10-12T18:00:23Z) - GeomGCL: Geometric Graph Contrastive Learning for Molecular Property
Prediction [47.70253904390288]
本研究では2次元および3次元ビューにまたがる分子の幾何を利用した新しいグラフコントラスト学習法を提案する。
具体的には、分子の2次元グラフと3次元グラフの両方のリッチな情報を適応的に活用するために、2次元幾何学的メッセージパッシングネットワーク(GeomMPNN)を考案する。
論文 参考訳(メタデータ) (2021-09-24T03:55:27Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z) - Self-Supervised Graph Transformer on Large-Scale Molecular Data [73.3448373618865]
分子表現学習のための新しいフレームワークGROVERを提案する。
GROVERは、分子の豊富な構造的および意味的な情報を、巨大な未標識分子データから学習することができる。
分子表現学習において、最大のGNNであり、最大のトレーニングデータセットである、1000万個の未標識分子に1億のパラメータを持つGROVERを事前訓練します。
論文 参考訳(メタデータ) (2020-06-18T08:37:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。