論文の概要: Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport
- arxiv url: http://arxiv.org/abs/2202.06208v3
- Date: Mon, 30 Oct 2023 02:20:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 05:09:22.374301
- Title: Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport
- Title(参考訳): メトリック学習による最適輸送による分子表現学習の改善
- Authors: Fang Wu, Nicolas Courty, Shuting Jin, Stan Z. Li
- Abstract要約: 分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
- 参考スコア(独自算出の注目度): 49.237577649802034
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training data are usually limited or heterogeneous in many chemical and
biological applications. Existing machine learning models for chemistry and
materials science fail to consider generalizing beyond training domains. In
this article, we develop a novel optimal transport-based algorithm termed MROT
to enhance their generalization capability for molecular regression problems.
MROT learns a continuous label of the data by measuring a new metric of domain
distances and a posterior variance regularization over the transport plan to
bridge the chemical domain gap. Among downstream tasks, we consider basic
chemical regression tasks in unsupervised and semi-supervised settings,
including chemical property prediction and materials adsorption selection.
Extensive experiments show that MROT significantly outperforms state-of-the-art
models, showing promising potential in accelerating the discovery of new
substances with desired properties.
- Abstract(参考訳): トレーニングデータは通常、多くの化学および生物学的応用において制限または不均一である。
既存の化学と材料科学の機械学習モデルは、訓練領域を超えて一般化することを考慮しない。
本稿では,分子レグレッション問題の一般化能力を高めるため,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは、新しい領域距離の測定値と、化学領域ギャップを埋める輸送計画に関する後続の分散正則化を計測することで、データの連続ラベルを学習する。
下流では, 化学特性予測や物質吸着選択など, 教師なし・半監督的な環境下での基本的な化学回帰タスクを検討する。
広範な実験により、mrotは最先端のモデルを大きく上回り、望ましい性質を持つ新しい物質の発見を加速する可能性を示した。
関連論文リスト
- Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Holistic chemical evaluation reveals pitfalls in reaction prediction
models [0.3065062372337749]
本稿では, より総合的な評価をめざして, 現状のアプローチに基づく新たな評価手法を提案する。
ChoRISOは、化学的に関連するシナリオを再現するために、複数の調整された分割と共に、キュレートされたデータセットである。
私たちの研究は、最終的に化学発見を加速できる堅牢な予測モデルへの道を開いた。
論文 参考訳(メタデータ) (2023-12-14T14:54:28Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Transfer learning for chemically accurate interatomic neural network
potentials [0.0]
密度汎関数計算から得られたデータに基づいてネットワークパラメータを事前学習することにより、より正確なab-initioデータに基づいてトレーニングされたモデルのサンプル効率が向上することを示す。
ANI-1x および ANI-1ccx データセット上で事前訓練および微調整されたGM-NN電位を提供する。
論文 参考訳(メタデータ) (2022-12-07T19:21:01Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Semi-Supervised Junction Tree Variational Autoencoder for Molecular
Property Prediction [0.0]
本研究では, 化学特性予測における半教師付き学習を容易にするため, 最先端分子生成法であるJT-VAEを改良した。
我々はJT-VAEアーキテクチャを活用し、分子特性予測から条件付き分子生成までのタスクに最適な解釈可能な表現を学習する。
論文 参考訳(メタデータ) (2022-08-10T03:06:58Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z) - Quantum Mechanics and Machine Learning Synergies: Graph Attention Neural
Networks to Predict Chemical Reactivity [7.799648230758492]
有機化学における官能基の反応性のスケーラブルな定量的測定が欠如している。
従来の量子化学研究では、メチルカチオンアフィニティ(MCA*)とメチルアニオンアフィニティ(MAA*)を導入しました。
MCA*およびMAA*は反応パラメータのよい推定を提供し、密度機能理論(DFT)のシミュレーションによる計算は時間がかかります。
論文 参考訳(メタデータ) (2021-03-24T19:05:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。