論文の概要: ReactXT: Understanding Molecular "Reaction-ship" via Reaction-Contextualized Molecule-Text Pretraining
- arxiv url: http://arxiv.org/abs/2405.14225v1
- Date: Thu, 23 May 2024 06:55:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-24 18:34:03.186709
- Title: ReactXT: Understanding Molecular "Reaction-ship" via Reaction-Contextualized Molecule-Text Pretraining
- Title(参考訳): ReactXT: 反応コンテキスト化された分子テキスト事前学習による分子「反応船」の理解
- Authors: Zhiyuan Liu, Yaorui Shi, An Zhang, Sihang Li, Enzhi Zhang, Xiang Wang, Kenji Kawaguchi, Tat-Seng Chua,
- Abstract要約: 反応テキストモデリングのためのReactXTと実験手順予測のためのOpenExpを提案する。
ReactXTは、インプットコンテキストの3つのタイプをインクリメンタルに事前トレーニングする。
私たちのコードはhttps://github.com/syr-cn/ReactXT.comで公開されています。
- 参考スコア(独自算出の注目度): 76.51346919370005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecule-text modeling, which aims to facilitate molecule-relevant tasks with a textual interface and textual knowledge, is an emerging research direction. Beyond single molecules, studying reaction-text modeling holds promise for helping the synthesis of new materials and drugs. However, previous works mostly neglect reaction-text modeling: they primarily focus on modeling individual molecule-text pairs or learning chemical reactions without texts in context. Additionally, one key task of reaction-text modeling -- experimental procedure prediction -- is less explored due to the absence of an open-source dataset. The task is to predict step-by-step actions of conducting chemical experiments and is crucial to automating chemical synthesis. To resolve the challenges above, we propose a new pretraining method, ReactXT, for reaction-text modeling, and a new dataset, OpenExp, for experimental procedure prediction. Specifically, ReactXT features three types of input contexts to incrementally pretrain LMs. Each of the three input contexts corresponds to a pretraining task to improve the text-based understanding of either reactions or single molecules. ReactXT demonstrates consistent improvements in experimental procedure prediction and molecule captioning and offers competitive results in retrosynthesis. Our code is available at https://github.com/syr-cn/ReactXT.
- Abstract(参考訳): 分子関連タスクをテキストインターフェースとテキスト知識で促進することを目的とした分子文モデリングが,新たな研究方向である。
単一分子の他に、反応テキストモデリングの研究は、新しい物質や薬物の合成を助けることを約束している。
主に、個々の分子とテキストのペアをモデル化するか、文脈でテキストなしで化学反応を学習することに焦点を当てている。
さらに、リアクションテキストモデリングの1つの重要なタスク -- 実験的なプロシージャ予測 -- は、オープンソースデータセットがないため、あまり調査されていない。
この課題は、化学実験を行う段階的な行動を予測することであり、化学合成の自動化に不可欠である。
上記の課題を解決するために、反応テキストモデリングのための新しい事前学習手法ReactXTと実験手順予測のための新しいデータセットOpenExpを提案する。
具体的には、ReactXTは3種類の入力コンテキストをインクリメンタルに事前トレーニングする。
3つの入力コンテキストはそれぞれ、反応または単一分子のテキストベースの理解を改善するための事前訓練タスクに対応する。
ReactXTは、実験的な手順予測と分子キャプションにおいて一貫した改善を示し、レトロシンセシスにおける競合的な結果を提供する。
私たちのコードはhttps://github.com/syr-cn/ReactXT.comで公開されています。
関連論文リスト
- PRESTO: Progressive Pretraining Enhances Synthetic Chemistry Outcomes [33.293741487835824]
MLLM(Multimodal Large Language Models)は、様々な科学分野において普及している。
しかし、現在のアプローチは化学反応を理解する上での複数の分子グラフ相互作用の重要な役割を無視することが多い。
PRESTOは、事前学習戦略とデータセット構成の包括的なベンチマークを統合することで、分子-テキストのモダリティギャップを橋渡しする新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-19T03:59:46Z) - T-Rex: Text-assisted Retrosynthesis Prediction [17.955825423710817]
T-Rexはテキストによる逆合成予測手法である。
ChatGPTのような事前訓練されたテキスト言語モデルを利用して、反応体の生成を支援する。
論文 参考訳(メタデータ) (2024-01-26T04:08:50Z) - Predictive Chemistry Augmented with Text Retrieval [37.59545092901872]
文献から得られたテキストで予測化学を直接拡張する新しい方法であるTextReactを紹介する。
TextReactは、所定の化学反応に関連するテキスト記述を検索し、それらを反応の分子的表現と整合させる。
反応条件の推薦と1段階の逆合成という2つの化学課題の枠組みを実証的に検証した。
論文 参考訳(メタデータ) (2023-12-08T07:40:59Z) - Multi-modal Molecule Structure-text Model for Text-based Retrieval and
Editing [107.49804059269212]
分子の化学構造とテキスト記述を共同で学習し, マルチモーダルな分子構造テキストモデル, MoleculeSTMを提案する。
実験において、分子STMは、新しい生化学的概念を創出するための最先端の一般化能力を得る。
論文 参考訳(メタデータ) (2022-12-21T06:18:31Z) - Retroformer: Pushing the Limits of Interpretable End-to-end
Retrosynthesis Transformer [15.722719721123054]
再合成予測は有機合成の基本的な課題の1つである。
本稿では,レトロシンセシス予測のためのトランスフォーマーに基づく新しいアーキテクチャであるRetroformerを提案する。
Retroformerは、エンドツーエンドのテンプレートフリーレトロシンセシスのための新しい最先端の精度に達する。
論文 参考訳(メタデータ) (2022-01-29T02:03:55Z) - Rxn Hypergraph: a Hypergraph Attention Model for Chemical Reaction
Representation [70.97737157902947]
現在、化学反応を強固に表現するための普遍的で広く採用されている方法は存在しない。
ここでは、グラフに基づく分子構造の表現を利用して、ハイパーグラフアテンションニューラルネットワークアプローチを開発し、テストする。
我々はこのハイパーグラフ表現を3つの独立な化学反応データセットを用いて3つの実験で評価した。
論文 参考訳(メタデータ) (2022-01-02T12:33:10Z) - RetroComposer: Discovering Novel Reactions by Composing Templates for
Retrosynthesis Prediction [63.14937611038264]
本稿では,テンプレート以外の新しいテンプレートを構築可能な,革新的な再合成予測フレームワークを提案する。
実験結果から,USPTO-50Kデータセットにおいて,328個のテスト反応のためのテンプレートを新たに作成できることが示唆された。
論文 参考訳(メタデータ) (2021-12-20T05:57:07Z) - RetroXpert: Decompose Retrosynthesis Prediction like a Chemist [60.463900712314754]
そこで我々は, テンプレートフリーな自動逆合成拡張アルゴリズムを考案した。
我々の方法はレトロシンセシスを2段階に分解する。
最先端のベースラインよりも優れている一方で、我々のモデルは化学的に合理的な解釈も提供する。
論文 参考訳(メタデータ) (2020-11-04T04:35:34Z) - Retrosynthesis Prediction with Conditional Graph Logic Network [118.70437805407728]
コンピュータ支援のレトロシンセシスは、化学と計算機科学の双方から新たな関心を集めている。
本稿では,グラフニューラルネットワーク上に構築された条件付きグラフィカルモデルであるConditional Graph Logic Networkを用いて,この課題に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-06T05:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。