論文の概要: MolSets: Molecular Graph Deep Sets Learning for Mixture Property
Modeling
- arxiv url: http://arxiv.org/abs/2312.16473v1
- Date: Wed, 27 Dec 2023 08:46:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 19:12:48.580395
- Title: MolSets: Molecular Graph Deep Sets Learning for Mixture Property
Modeling
- Title(参考訳): MolSets: 混合特性モデリングのための分子グラフ深層集合学習
- Authors: Hengrui Zhang, Jie Chen, James M. Rondinelli, Wei Chen
- Abstract要約: 分子混合物の特殊な機械学習モデルであるMollSetsを提案する。
個々の分子をグラフとして表現し、それらの混合物を集合として、モルセットはそれを混合レベルで集約する。
リチウム電池電解質の導電率予測におけるMollSetsの有効性を実証し, 化学空間の仮想スクリーニングにおけるその利点を明らかにする。
- 参考スコア(独自算出の注目度): 14.067533753010897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in machine learning (ML) have expedited materials discovery
and design. One significant challenge faced in ML for materials is the
expansive combinatorial space of potential materials formed by diverse
constituents and their flexible configurations. This complexity is particularly
evident in molecular mixtures, a frequently explored space for materials such
as battery electrolytes. Owing to the complex structures of molecules and the
sequence-independent nature of mixtures, conventional ML methods have
difficulties in modeling such systems. Here we present MolSets, a specialized
ML model for molecular mixtures. Representing individual molecules as graphs
and their mixture as a set, MolSets leverages a graph neural network and the
deep sets architecture to extract information at the molecule level and
aggregate it at the mixture level, thus addressing local complexity while
retaining global flexibility. We demonstrate the efficacy of MolSets in
predicting the conductivity of lithium battery electrolytes and highlight its
benefits in virtual screening of the combinatorial chemical space.
- Abstract(参考訳): 機械学習(ML)の最近の進歩は、材料発見と設計を迅速化している。
材料に対するMLで直面する重要な課題の1つは、多種多様な構成物とその柔軟な構成によって形成される潜在的な材料の拡張的な組合せ空間である。
この複雑さは、バッテリ電解質などの材料の頻繁に研究される空間である分子混合物において特に顕著である。
分子の複雑な構造と混合物のシーケンスに依存しない性質のため、従来のml法はそのようなシステムのモデリングが困難である。
ここでは分子混合物の特殊なMLモデルであるMollSetsを紹介する。
個々の分子をグラフとして、それらの混合物をセットとして表現するmolsetsは、グラフニューラルネットワークとディープセットアーキテクチャを利用して、分子レベルで情報を抽出し、混合レベルで集約する。
リチウム電池電解質の導電率予測におけるMollSetsの有効性を実証し, 複合化学空間の仮想スクリーニングにおける利点を明らかにする。
関連論文リスト
- SE3Set: Harnessing equivariant hypergraph neural networks for molecular representation learning [27.713870291922333]
分子表現学習に適したSE(3)同変ハイパーグラフニューラルネットワークアーキテクチャを開発した。
SE3Setは、小さな分子データセットのための最先端(SOTA)モデルと同等のパフォーマンスを示している。
MD22データセットを上回り、全ての分子で約20%の精度で顕著な改善を達成している。
論文 参考訳(メタデータ) (2024-05-26T10:43:16Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - Enhanced sampling of robust molecular datasets with uncertainty-based
collective variables [0.0]
化学関連データポイントの取得を導くために,不確実性を集合変数(CV)として活用する手法を提案する。
このアプローチでは、1つのモデルからのガウス混合モデルに基づく不確実性測定を、偏りのある分子動力学シミュレーションのためのCVとして採用する。
論文 参考訳(メタデータ) (2024-02-06T06:42:51Z) - LLamol: A Dynamic Multi-Conditional Generative Transformer for De Novo
Molecular Design [0.0]
LLamolはLLama 2アーキテクチャに基づいた単一の新しい生成トランスフォーマーモデルである。
モデルが最大4つの条件で単一条件および多条件の有機分子生成を順応的に処理できることを実証する。
より詳しくは,個別に,あるいは数値特性と組み合わせて,トークンシーケンスを条件付けに活用するモデルの能力について紹介する。
論文 参考訳(メタデータ) (2023-11-24T10:59:12Z) - From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Learning Over Molecular Conformer Ensembles: Datasets and Benchmarks [44.934084652800976]
コンフォーマーアンサンブルを用いた学習の可能性を徹底的に評価するための,最初のMoleculAR Conformer Ensemble Learningベンチマークを導入する。
その結果,コンバータ空間からの直接学習は,様々なタスクやモデルの性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2023-09-29T20:06:46Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。