論文の概要: ReactionT5: a large-scale pre-trained model towards application of
limited reaction data
- arxiv url: http://arxiv.org/abs/2311.06708v1
- Date: Sun, 12 Nov 2023 02:25:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-14 17:19:56.916193
- Title: ReactionT5: a large-scale pre-trained model towards application of
limited reaction data
- Title(参考訳): 反応T5:限定反応データの適用に向けた大規模事前学習モデル
- Authors: Tatsuya Sagawa and Ryosuke Kojima
- Abstract要約: トランスフォーマーベースのディープニューラルネットワークは、分子を記号配列として扱うことによって、分子関連予測タスクの分野に革命をもたらした。
本稿では,オープン・リアクション・データベース(ORD)の事前学習を利用する新しいモデルであるReactionT5を提案する。
我々はさらに、収量予測と製品予測タスクのためにこのモデルを微調整し、限られた微調整データでもその印象的な性能を実証する。
- 参考スコア(独自算出の注目度): 4.206175795966693
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transformer-based deep neural networks have revolutionized the field of
molecular-related prediction tasks by treating molecules as symbolic sequences.
These models have been successfully applied in various organic chemical
applications by pretraining them with extensive compound libraries and
subsequently fine-tuning them with smaller in-house datasets for specific
tasks. However, many conventional methods primarily focus on single molecules,
with limited exploration of pretraining for reactions involving multiple
molecules. In this paper, we propose ReactionT5, a novel model that leverages
pretraining on the Open Reaction Database (ORD), a publicly available
large-scale resource. We further fine-tune this model for yield prediction and
product prediction tasks, demonstrating its impressive performance even with
limited fine-tuning data compared to traditional models. The pre-trained
ReactionT5 model is publicly accessible on the Hugging Face platform.
- Abstract(参考訳): トランスフォーマーベースのディープニューラルネットワークは、分子を記号配列として扱うことによって、分子関連予測タスクの分野に革命をもたらした。
これらのモデルは、幅広い複合ライブラリで事前訓練し、その後、特定のタスクのためにより小さな内部データセットで微調整することで、様々な有機化学応用に成功している。
しかし、多くの従来の方法は主に単一分子に焦点を当てており、複数の分子を含む反応の事前訓練は限られていた。
本稿では,公開可能な大規模リソースであるオープンリアクションデータベース(ord)の事前トレーニングを活用した,新しいモデルであるreactiont5を提案する。
このモデルを収率予測と製品予測タスク用に微調整し,従来のモデルと比較して微調整データが少ない場合でもその印象的な性能を示す。
事前訓練されたReactionT5モデルは、Hugging Faceプラットフォーム上で公開されている。
関連論文リスト
- RGFN: Synthesizable Molecular Generation Using GFlowNets [51.33672611338754]
本稿では,化学反応の空間内で直接動作するGFlowNetフレームワークの拡張であるReaction-GFlowNetを提案する。
RGFNは、生成した候補の同等の品質を維持しながら、アウト・オブ・ボックスの合成を可能にする。
提案手法の有効性を,事前訓練されたプロキシモデルやGPUアクセラレーションドッキングなど,さまざまなオラクルモデルに適用した。
論文 参考訳(メタデータ) (2024-06-01T13:11:11Z) - Specialising and Analysing Instruction-Tuned and Byte-Level Language Models for Organic Reaction Prediction [0.0]
トランスフォーマーベースのエンコーダデコーダモデルは化学反応予測タスクにおいて顕著な結果を示した。
これらのモデルは通常、数千万の未標識分子を用いた事前学習に依存している。
FlanT5とByT5はタスク特異的微調整による有機反応予測に効果的に機能するか?
論文 参考訳(メタデータ) (2024-05-17T08:39:56Z) - UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Molecule-Edit Templates for Efficient and Accurate Retrosynthesis
Prediction [0.16070833439280313]
最小限のテンプレートを用いて反応を予測する機械学習モデルMETROを紹介する。
標準ベンチマークで最先端の結果を得る。
論文 参考訳(メタデータ) (2023-10-11T09:00:02Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Data Transfer Approaches to Improve Seq-to-Seq Retrosynthesis [1.6449390849183363]
再合成は、化学反応によって与えられた生成物化合物を合成するために反応化合物を推測する問題である。
レトロ合成に関する最近の研究は、より洗練された予測モデルの提案に焦点を当てている。
モデルをフィードするデータセットは、最高の一般化モデルを達成する上でも重要な役割を果たす。
論文 参考訳(メタデータ) (2020-10-02T05:27:51Z) - Learning Graph Models for Retrosynthesis Prediction [90.15523831087269]
再合成予測は有機合成の基本的な問題である。
本稿では,前駆体分子のグラフトポロジーが化学反応中にほとんど変化しないという考え方を生かしたグラフベースのアプローチを提案する。
提案モデルでは,テンプレートフリーおよび半テンプレートベースの手法よりも高い5,3.7%の精度でトップ1の精度を実現している。
論文 参考訳(メタデータ) (2020-06-12T09:40:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。