論文の概要: Multimodal Transformer-based Model for Buchwald-Hartwig and
Suzuki-Miyaura Reaction Yield Prediction
- arxiv url: http://arxiv.org/abs/2204.14062v1
- Date: Wed, 27 Apr 2022 07:28:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 10:28:57.014473
- Title: Multimodal Transformer-based Model for Buchwald-Hartwig and
Suzuki-Miyaura Reaction Yield Prediction
- Title(参考訳): Buchwald-Hartwig と Suzuki-Miyaura 反応収率予測のためのマルチモーダルトランスモデル
- Authors: Shimaa Baraka and Ahmed M. El Kerdawy
- Abstract要約: このモデルは、事前訓練された双方向トランスフォーマーベースのエンコーダ(BERT)と、回帰ヘッドを備えた多層パーセプトロン(MLP)から構成され、収量を予測する。
我々は、Buchwald-Hartwigのサンプル外のデータセット分割でモデルのパフォーマンスをテストし、最先端技術で同等の結果を得た。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the yield percentage of a chemical reaction is useful in many
aspects such as reducing wet-lab experimentation by giving the priority to the
reactions with a high predicted yield. In this work we investigated the use of
multiple type inputs to predict chemical reaction yield. We used simplified
molecular-input line-entry system (SMILES) as well as calculated chemical
descriptors as model inputs. The model consists of a pre-trained bidirectional
transformer-based encoder (BERT) and a multi-layer perceptron (MLP) with a
regression head to predict the yield. We experimented on two high throughput
experimentation (HTE) datasets for Buchwald-Hartwig and Suzuki-Miyaura
reactions. The experiments show improvements in the prediction on both datasets
compared to systems using only SMILES or chemical descriptors as input. We also
tested the model's performance on out-of-sample dataset splits of
Buchwald-Hartwig and achieved comparable results with the state-of-the-art. In
addition to predicting the yield, we demonstrated the model's ability to
suggest the optimum (highest yield) reaction conditions. The model was able to
suggest conditions that achieves 94% of the optimum reported yields. This
proves the model to be useful in achieving the best results in the wet lab
without expensive experimentation.
- Abstract(参考訳): 化学反応の収率を予測することは、高い収率の反応に優先順位を与えることにより湿式実験を減らすなど、多くの面で有用である。
本研究では, 化学反応収率の予測に多型入力を用いたことを検討した。
簡単な分子インプット線入力システム (SMILES) と計算化学記述子をモデル入力として使用した。
このモデルは、事前訓練された双方向トランスフォーマーベースのエンコーダ(BERT)と、回帰ヘッドを備えた多層パーセプトロン(MLP)から構成され、収量を予測する。
Buchwald-Hartwig と Suzuki-Miyaura の2つの高スループット実験データセットを実験した。
実験では、SMILESや化学記述子のみを入力として使用するシステムと比較して、両方のデータセットの予測が改善された。
また、Buchwald-Hartwigのサンプル外のデータセット分割でモデルのパフォーマンスをテストし、最先端技術で同等の結果を得た。
収率の予測に加えて,モデルが最適(最大収率)反応条件を示唆する能力を示した。
このモデルでは、最適収率の94%を達成する条件を示唆することができた。
これは、このモデルが高価な実験なしでウェットラボで最高の結果を得るのに役立つことを証明している。
関連論文リスト
- Investigating the Robustness of Counterfactual Learning to Rank Models: A Reproducibility Study [61.64685376882383]
ランク付け学習(CLTR: Counterfactual Learning to rank)は、IRコミュニティにおいて、ログ化された大量のユーザインタラクションデータを活用してランキングモデルをトレーニングする能力において、大きな注目を集めている。
本稿では,複雑かつ多様な状況における既存のCLTRモデルのロバスト性について検討する。
その結果, DLAモデルとIPS-DCMは, PS-PBMやPSSよりも, オフラインの確率推定による堅牢性が高いことがわかった。
論文 参考訳(メタデータ) (2024-04-04T10:54:38Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Comparing Machine Learning Techniques for Alfalfa Biomass Yield
Prediction [0.8808021343665321]
アルファルファの作物は 家畜の餌として 世界的に重要で 効率的な植え付けと収穫は 多くの産業に役立ちます
機械学習を用いてアルファルファやその他の作物の収量を予測する最近の研究は、有望であることが示されている。
これまでの取り組みでは、リモートセンシング、天気、植林、土壌データを使用して、収量予測のための機械学習モデルをトレーニングしていた。
論文 参考訳(メタデータ) (2022-10-20T13:00:33Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - MoEfication: Conditional Computation of Transformer Models for Efficient
Inference [66.56994436947441]
トランスフォーマーベースの事前学習言語モデルは、パラメータ容量が大きいため、ほとんどのNLPタスクにおいて優れた性能を実現することができるが、計算コストも大きい。
スパースアクティベーション現象に基づく条件計算により,大規模モデル推論を高速化する。
そこで本研究では,モデルサイズが等しいMoE(Mix-of-experts)バージョン,すなわちMoEficationに変換することを提案する。
論文 参考訳(メタデータ) (2021-10-05T02:14:38Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Data Transfer Approaches to Improve Seq-to-Seq Retrosynthesis [1.6449390849183363]
再合成は、化学反応によって与えられた生成物化合物を合成するために反応化合物を推測する問題である。
レトロ合成に関する最近の研究は、より洗練された予測モデルの提案に焦点を当てている。
モデルをフィードするデータセットは、最高の一般化モデルを達成する上でも重要な役割を果たす。
論文 参考訳(メタデータ) (2020-10-02T05:27:51Z) - Coupling Machine Learning and Crop Modeling Improves Crop Yield
Prediction in the US Corn Belt [2.580765958706854]
本研究では,米コーンベルトにおける作物モデルと機械学習(ML)の結合によるトウモロコシ収量予測の改善について検討した。
主な目的は、ハイブリッドアプローチ(クロップモデリング+ML)がより良い予測をもたらすかどうかを探求し、トウモロコシ収量予測のためにMLと最も効果的に統合できる作物モデルから特徴を決定することである。
論文 参考訳(メタデータ) (2020-07-28T16:22:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。