論文の概要: Scalable Geometric Deep Learning on Molecular Graphs
- arxiv url: http://arxiv.org/abs/2112.03364v1
- Date: Mon, 6 Dec 2021 21:29:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 15:59:55.426659
- Title: Scalable Geometric Deep Learning on Molecular Graphs
- Title(参考訳): 分子グラフによるスケーラブルな幾何学的深層学習
- Authors: Nathan C. Frey, Siddharth Samsi, Joseph McDonald, Lin Li, Connor W.
Coley, Vijay Gadepally
- Abstract要約: トレーニングデータの量、モデルアーキテクチャのサイズと複雑さ、計算インフラの規模などに関して、ボットネックは、分子や物質のディープラーニングのスケーリングを制限する重要な要素である。
分子深層学習手法をスケーリングする軽量フレームワークであるtextitLitMatter$を提示する。
- 参考スコア(独自算出の注目度): 12.029058347116253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning in molecular and materials sciences is limited by the lack of
integration between applied science, artificial intelligence, and
high-performance computing. Bottlenecks with respect to the amount of training
data, the size and complexity of model architectures, and the scale of the
compute infrastructure are all key factors limiting the scaling of deep
learning for molecules and materials. Here, we present $\textit{LitMatter}$, a
lightweight framework for scaling molecular deep learning methods. We train
four graph neural network architectures on over 400 GPUs and investigate the
scaling behavior of these methods. Depending on the model architecture,
training time speedups up to $60\times$ are seen. Empirical neural scaling
relations quantify the model-dependent scaling and enable optimal compute
resource allocation and the identification of scalable molecular geometric deep
learning model implementations.
- Abstract(参考訳): 分子・材料科学におけるディープラーニングは、応用科学、人工知能、高性能コンピューティングの統合の欠如によって制限される。
トレーニングデータの量、モデルアーキテクチャのサイズと複雑さ、計算インフラの規模などについては、すべて、分子や物質のディープラーニングのスケーリングを制限する重要な要素である。
ここでは分子深層学習手法をスケーリングするための軽量フレームワークである$\textit{LitMatter}$を示す。
400以上のgpu上で4つのグラフニューラルネットワークアーキテクチャをトレーニングし、これらの手法のスケーリング挙動を調査した。
モデルアーキテクチャによっては、60\times$までのトレーニング時間のスピードアップが見られる。
経験的ニューラルスケーリング関係は、モデル依存のスケーリングを定量化し、最適な計算資源割り当てとスケーラブルな分子幾何学的深層学習モデル実装の同定を可能にする。
関連論文リスト
- A Dynamical Model of Neural Scaling Laws [79.59705237659547]
ネットワークトレーニングと一般化の解決可能なモデルとして,勾配降下で訓練されたランダムな特徴モデルを分析する。
我々の理論は、データの繰り返し再利用により、トレーニングとテスト損失のギャップが徐々に増大することを示している。
論文 参考訳(メタデータ) (2024-02-02T01:41:38Z) - CTAGE: Curvature-Based Topology-Aware Graph Embedding for Learning
Molecular Representations [11.12640831521393]
分子グラフデータから構造的洞察を抽出するために,$k$hopの離散リッチ曲率を用いたCTAGEの埋め込み手法を提案する。
その結果,ノード曲率の導入は,現在のグラフニューラルネットワークフレームワークの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-07-25T06:13:01Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Extreme Acceleration of Graph Neural Network-based Prediction Models for
Quantum Chemistry [7.592530794455257]
本稿では,分子特性予測のためのグラフニューラルネットワークのトレーニングをスケールアップするための,ハードウェアとソフトウェアの共同設計手法を提案する。
本稿では,分子グラフのバッチを固定サイズパックに結合して冗長計算やメモリを不要にするアルゴリズムを提案する。
このような共同設計手法により、分子特性予測モデルのトレーニング時間を数日から2時間未満に短縮できることを示す。
論文 参考訳(メタデータ) (2022-11-25T01:30:18Z) - ParticleGrid: Enabling Deep Learning using 3D Representation of
Materials [0.39146761527401425]
我々は、$textitParticleGrid$で生成された3Dグリッドの有効性を示し、3D畳み込みニューラルネットワークを用いて分子エネルギー特性を正確に予測する。
我々のモデルは平均2乗誤差0.006を得ることができ、計算コストの高い密度汎関数理論を用いて計算された値とほぼ一致する。
論文 参考訳(メタデータ) (2022-11-15T21:03:34Z) - ViSNet: an equivariant geometry-enhanced graph neural network with
vector-scalar interactive message passing for molecules [69.05950120497221]
本稿では、幾何学的特徴をエレガントに抽出し、分子構造を効率的にモデル化する同変幾何拡張グラフニューラルネットワークViSNetを提案する。
提案するViSNetは,MD17,MD17,MD22を含む複数のMDベンチマークにおける最先端の手法よりも優れ,QM9およびMolecule3Dデータセット上での優れた化学的特性予測を実現する。
論文 参考訳(メタデータ) (2022-10-29T07:12:46Z) - When does deep learning fail and how to tackle it? A critical analysis
on polymer sequence-property surrogate models [1.0152838128195467]
ディープラーニングモデルは、高分子特性の予測において人気と有効性を高めている。
これらのモデルは、既存のデータを用いて構築することができ、ポリマー特性の迅速な予測に有用である。
しかし,ディープラーニングモデルの性能は,そのトポロジやトレーニングデータの量と密接に関連している。
論文 参考訳(メタデータ) (2022-10-12T23:04:10Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - 3D Infomax improves GNNs for Molecular Property Prediction [1.9703625025720701]
本稿では,2次元分子グラフのみに与えられる分子の幾何学をモデル化するための事前学習モデルを提案する。
我々は,3次元事前学習が幅広い特性に対して大きな改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-08T13:30:49Z) - GeoMol: Torsional Geometric Generation of Molecular 3D Conformer
Ensembles [60.12186997181117]
分子グラフからの分子の3Dコンホメーラーアンサンブルの予測は、化学情報学と薬物発見の領域において重要な役割を担っている。
既存の生成モデルは、重要な分子幾何学的要素のモデリングの欠如を含むいくつかの欠点がある。
エンド・ツー・エンド、非自己回帰、SE(3)不変の機械学習手法であるGeoMolを提案し、3Dコンバータを生成する。
論文 参考訳(メタデータ) (2021-06-08T14:17:59Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。