論文の概要: Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport
- arxiv url: http://arxiv.org/abs/2202.06208v3
- Date: Mon, 30 Oct 2023 02:20:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 05:09:22.374301
- Title: Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport
- Title(参考訳): メトリック学習による最適輸送による分子表現学習の改善
- Authors: Fang Wu, Nicolas Courty, Shuting Jin, Stan Z. Li
- Abstract要約: 分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
- 参考スコア(独自算出の注目度): 49.237577649802034
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training data are usually limited or heterogeneous in many chemical and
biological applications. Existing machine learning models for chemistry and
materials science fail to consider generalizing beyond training domains. In
this article, we develop a novel optimal transport-based algorithm termed MROT
to enhance their generalization capability for molecular regression problems.
MROT learns a continuous label of the data by measuring a new metric of domain
distances and a posterior variance regularization over the transport plan to
bridge the chemical domain gap. Among downstream tasks, we consider basic
chemical regression tasks in unsupervised and semi-supervised settings,
including chemical property prediction and materials adsorption selection.
Extensive experiments show that MROT significantly outperforms state-of-the-art
models, showing promising potential in accelerating the discovery of new
substances with desired properties.
- Abstract(参考訳): トレーニングデータは通常、多くの化学および生物学的応用において制限または不均一である。
既存の化学と材料科学の機械学習モデルは、訓練領域を超えて一般化することを考慮しない。
本稿では,分子レグレッション問題の一般化能力を高めるため,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは、新しい領域距離の測定値と、化学領域ギャップを埋める輸送計画に関する後続の分散正則化を計測することで、データの連続ラベルを学習する。
下流では, 化学特性予測や物質吸着選択など, 教師なし・半監督的な環境下での基本的な化学回帰タスクを検討する。
広範な実験により、mrotは最先端のモデルを大きく上回り、望ましい性質を持つ新しい物質の発見を加速する可能性を示した。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Analysis of Atom-level pretraining with Quantum Mechanics (QM) data for Graph Neural Networks Molecular property models [0.0]
量子力学(QM)データを用いた原子レベルの事前トレーニングは、トレーニングデータとテストデータ間の分布類似性に関する仮定違反を軽減することができることを示す。
隠れ状態の分子表現を解析し、QMデータに対する分子レベルと原子レベルの事前学習の効果を比較するのは、これが初めてである。
論文 参考訳(メタデータ) (2024-05-23T17:51:05Z) - Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Transfer learning for chemically accurate interatomic neural network
potentials [0.0]
密度汎関数計算から得られたデータに基づいてネットワークパラメータを事前学習することにより、より正確なab-initioデータに基づいてトレーニングされたモデルのサンプル効率が向上することを示す。
ANI-1x および ANI-1ccx データセット上で事前訓練および微調整されたGM-NN電位を提供する。
論文 参考訳(メタデータ) (2022-12-07T19:21:01Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Semi-Supervised Junction Tree Variational Autoencoder for Molecular
Property Prediction [0.0]
本研究では, 化学特性予測における半教師付き学習を容易にするため, 最先端分子生成法であるJT-VAEを改良した。
我々はJT-VAEアーキテクチャを活用し、分子特性予測から条件付き分子生成までのタスクに最適な解釈可能な表現を学習する。
論文 参考訳(メタデータ) (2022-08-10T03:06:58Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。