論文の概要: Modeling non-uniform uncertainty in Reaction Prediction via Boosting and
Dropout
- arxiv url: http://arxiv.org/abs/2310.04674v1
- Date: Sat, 7 Oct 2023 03:18:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 16:49:11.447604
- Title: Modeling non-uniform uncertainty in Reaction Prediction via Boosting and
Dropout
- Title(参考訳): ブースティングとドロップアウトによる反応予測における不均一不確かさのモデル化
- Authors: Taicheng Guo, Changsheng Ma, Xiuying Chen, Bozhao Nan, Kehan Guo,
Shichao Pei, Nitesh V. Chawla, Olaf Wiest, Xiangliang Zhang
- Abstract要約: 変分オートエンコーダ(VAE)フレームワークは通常、反応予測の課題に取り組むために使用される。
製品生成にランダム性を導入し、さまざまなモデルをアンサンブルし、潜在的な結果の範囲をカバーします。
我々は,最も信頼性の高い製品を優先して,昇降と降降から予測を統一するランク付け手法を設計する。
- 参考スコア(独自算出の注目度): 44.5946975612778
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reaction prediction has been recognized as a critical task in synthetic
chemistry, where the goal is to predict the outcome of a reaction based on the
given reactants. With the widespread adoption of generative models, the
Variational Autoencoder(VAE) framework has typically been employed to tackle
challenges in reaction prediction, where the reactants are encoded as a
condition for the decoder, which then generates the product. Despite
effectiveness, these conditional VAE (CVAE) models still fail to adequately
account for the inherent uncertainty in reaction prediction, which primarily
stems from the stochastic reaction process. The principal limitations are
twofold. Firstly, in these CVAE models, the prior is independent of the
reactants, leading to a default wide and assumed uniform distribution variance
of the generated product. Secondly, reactants with analogous molecular
representations are presumed to undergo similar electronic transition
processes, thereby producing similar products. This hinders the ability to
model diverse reaction mechanisms effectively. Since the variance in outcomes
is inherently non-uniform, we are thus motivated to develop a framework that
generates reaction products with non-uniform uncertainty. Firstly, we eliminate
the latent variable in previous CVAE models to mitigate uncontrol-label noise.
Instead, we introduce randomness into product generation via boosting to
ensemble diverse models and cover the range of potential outcomes, and through
dropout to secure models with minor variations. Additionally, we design a
ranking method to union the predictions from boosting and dropout, prioritizing
the most plausible products. Experimental results on the largest reaction
prediction benchmark USPTO-MIT show the superior performance of our proposed
method in modeling the non-uniform uncertainty compared to baselines.
- Abstract(参考訳): 反応予測は合成化学において重要な課題として認識され、そこでは与えられた反応物に基づいて反応の結果を予測することが目的である。
生成モデルの普及に伴い、変分オートエンコーダ(vae)フレームワークは一般的に反応予測の課題に対処するために用いられており、反応物質はデコーダの条件としてエンコードされ、生成物を生成する。
有効性にもかかわらず、これらの条件付きVAE(CVAE)モデルは、主に確率的反応過程に由来する反応予測の固有の不確かさを適切に説明できない。
主な制限は2つある。
第一に、これらのCVAEモデルでは、前者は反応物とは独立であり、デフォルトの広さと仮定された生成物の均一分布分散をもたらす。
第二に、類似の分子表現を持つ反応体は、類似の電子遷移過程を経て、類似した生成物を生成すると推定される。
これにより、多様な反応機構を効果的にモデル化する能力が阻害される。
結果のばらつきは本質的に不均一であるため、不均一な不確かさを持つ反応生成物を生成するフレームワークを開発する動機となっている。
まず,従来のCVAEモデルの潜在変数を除去し,非制御ラベルノイズを軽減する。
代わりに、さまざまなモデルをアンサンブルし、潜在的な結果の範囲をカバーし、小さなバリエーションを持つ安全なモデルへのドロップアウトを通じて、製品生成にランダム性を導入します。
さらに, ブースティングとドロップアウトの予測を結合し, もっとも妥当な製品を優先するランキング手法を考案する。
最大反応予測ベンチマークUSPTO-MITの実験結果から, ベースラインと比較して一様でない不確かさをモデル化する上で, 提案手法の優れた性能を示した。
関連論文リスト
- Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
本稿では,様々な有機反応関連タスクに適した新しい化学反応表現学習モデルであるモデルネームを紹介する。
反応物質と生成物との原子対応を統合することにより、反応中に生じる分子変換を識別し、反応機構の理解を深める。
反応条件を化学反応表現に組み込むアダプタ構造を設計し、様々な反応条件を処理し、様々なデータセットや下流タスク、例えば反応性能予測に適応できるようにした。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - Beyond Major Product Prediction: Reproducing Reaction Mechanisms with
Machine Learning Models Trained on a Large-Scale Mechanistic Dataset [10.968137261042715]
有機反応の機械的理解は、反応の発生、不純物予測、そして原則として反応発見を促進する。
いくつかの機械学習モデルは、反応生成物を予測するタスクに対処しようとしているが、反応機構を予測するための拡張は、対応する力学データセットの欠如によって妨げられている。
実験によって報告された反応物質と生成物の中間体を専門家の反応テンプレートを用いて入力し、その結果の5,184,184個の基本ステップに基づいて機械学習モデルを訓練することにより、そのようなデータセットを構築する。
論文 参考訳(メタデータ) (2024-03-07T15:26:23Z) - AI for Interpretable Chemistry: Predicting Radical Mechanistic Pathways
via Contrastive Learning [45.379791270351184]
RMechRPは、新しいディープラーニングベースの反応予測システムである。
我々は、ラジカル反応の公開データベースであるRMechDBを用いてモデルを開発し、訓練する。
本研究は,RMechRPが正確かつ解釈可能な予測に有効であることを示す。
論文 参考訳(メタデータ) (2023-11-02T09:47:27Z) - Doubly Stochastic Graph-based Non-autoregressive Reaction Prediction [59.41636061300571]
電子再分配予測を得るために2つの二重自己アテンションマッピングを組み合わせた新しいフレームワークを提案する。
提案手法は,非自己回帰モデルの予測性能を常に向上することを示す。
論文 参考訳(メタデータ) (2023-06-05T14:15:39Z) - MARS: A Motif-based Autoregressive Model for Retrosynthesis Prediction [54.75583184356392]
本稿では,レトロシンセシス予測のための新しいエンドツーエンドグラフ生成モデルを提案する。
反応中心を逐次同定し、合成子を生成し、合成子にモチーフを加えて反応子を生成する。
ベンチマークデータセットの実験では、提案されたモデルが従来の最先端のアルゴリズムを大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2022-09-27T06:29:35Z) - Non-Autoregressive Electron Redistribution Modeling for Reaction
Prediction [26.007965383304864]
反応を1ショットで予測する非自己回帰学習パラダイムを考案する。
任意の電子フローとして反応を定式化し、新しいマルチポインター復号ネットワークで予測する。
USPTO-MITデータセットの実験により、我々の手法は最先端のトップ1の精度を確立した。
論文 参考訳(メタデータ) (2021-06-08T16:39:08Z) - Non-autoregressive electron flow generation for reaction prediction [15.98143959075733]
このような連続的な生成を回避し、非自動回帰的な反応を予測する新しいデコーダを考案する。
物理化学の洞察に基づいて、分子グラフのエッジ編集を電子フローとして表現し、並列に予測できます。
このモデルは,最先端のtop-1精度とtop-kサンプリングにおける同等の性能で,推定遅延を桁違いに低減する。
論文 参考訳(メタデータ) (2020-12-16T10:01:26Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。