論文の概要: Predictive Chemistry Augmented with Text Retrieval
- arxiv url: http://arxiv.org/abs/2312.04881v1
- Date: Fri, 8 Dec 2023 07:40:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-11 15:46:18.089480
- Title: Predictive Chemistry Augmented with Text Retrieval
- Title(参考訳): テキスト検索による予測化学
- Authors: Yujie Qian, Zhening Li, Zhengkai Tu, Connor W. Coley, Regina Barzilay
- Abstract要約: 文献から得られたテキストで予測化学を直接拡張する新しい方法であるTextReactを紹介する。
TextReactは、所定の化学反応に関連するテキスト記述を検索し、それらを反応の分子的表現と整合させる。
反応条件の推薦と1段階の逆合成という2つの化学課題の枠組みを実証的に検証した。
- 参考スコア(独自算出の注目度): 37.59545092901872
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper focuses on using natural language descriptions to enhance
predictive models in the chemistry field. Conventionally, chemoinformatics
models are trained with extensive structured data manually extracted from the
literature. In this paper, we introduce TextReact, a novel method that directly
augments predictive chemistry with texts retrieved from the literature.
TextReact retrieves text descriptions relevant for a given chemical reaction,
and then aligns them with the molecular representation of the reaction. This
alignment is enhanced via an auxiliary masked LM objective incorporated in the
predictor training. We empirically validate the framework on two chemistry
tasks: reaction condition recommendation and one-step retrosynthesis. By
leveraging text retrieval, TextReact significantly outperforms state-of-the-art
chemoinformatics models trained solely on molecular data.
- Abstract(参考訳): 本稿では,化学分野での予測モデルを強化するために,自然言語記述を使うことに着目する。
従来の化学情報学モデルは、文献から手作業で抽出した広範な構造化データを用いて訓練される。
本稿では,本論文から得られたテキストを用いて予測化学を直接拡張する新しい手法であるTextReactを紹介する。
TextReactは、所定の化学反応に関連するテキスト記述を取得し、それらを反応の分子的表現と整合させる。
このアライメントは、予測者訓練に組み込まれた補助マスクlm目標を介して強化される。
反応条件の推薦と1段階の逆合成という2つの化学課題の枠組みを実証的に検証した。
テキスト検索を活用することで、TextReactは分子データのみに基づいてトレーニングされた最先端のケモインフォマティクスモデルを大幅に上回る。
関連論文リスト
- ReactXT: Understanding Molecular "Reaction-ship" via Reaction-Contextualized Molecule-Text Pretraining [76.51346919370005]
反応テキストモデリングのためのReactXTと実験手順予測のためのOpenExpを提案する。
ReactXTは、インプットコンテキストの3つのタイプをインクリメンタルに事前トレーニングする。
私たちのコードはhttps://github.com/syr-cn/ReactXT.comで公開されています。
論文 参考訳(メタデータ) (2024-05-23T06:55:59Z) - UAlign: Pushing the Limit of Template-free Retrosynthesis Prediction with Unsupervised SMILES Alignment [51.49238426241974]
本稿では,テンプレートのないグラフ・ツー・シーケンスパイプラインであるUAlignを紹介した。
グラフニューラルネットワークとトランスフォーマーを組み合わせることで、分子固有のグラフ構造をより効果的に活用することができる。
論文 参考訳(メタデータ) (2024-03-25T03:23:03Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - ReacLLaMA: Merging chemical and textual information in chemical
reactivity AI models [0.0]
化学反応性モデルは、分類(success/failure)や回帰(product yield)タスクの形式で化学反応の結果を予測するために開発されている。
報告されたモデルの大半は、反応剤、生成物、試薬、溶媒などの化学情報のみに基づいて訓練されている。
ここでは、Graphormerの反応性モデルを強化し、その精度を向上させることを目的とした手続きテキストの組み入れについて述べる。
論文 参考訳(メタデータ) (2024-01-30T18:57:08Z) - ReactIE: Enhancing Chemical Reaction Extraction with Weak Supervision [27.850325653751078]
構造化化学反応情報は、実験とコンピュータ支援医薬品設計のような先進的な取り組みに携わる化学者にとって重要な役割を担っている。
科学的文献から構造的反応を抽出することが重要であるにもかかわらず、この目的のためのデータアノテーションは、ドメインの専門家が必要とする多大な労力のためにコストを抑えることができる。
本稿では,2つの弱教師付き事前学習手法を組み合わせたReactIEを提案する。本手法では,テキスト内の頻繁なパターンを言語的手がかりとして用いて,化学反応の特異な特性を同定する。
論文 参考訳(メタデータ) (2023-07-04T02:52:30Z) - MolXPT: Wrapping Molecules with Text for Generative Pre-training [141.0924452870112]
MolXPTは、テキストでラップされたSMILESで事前訓練されたテキストと分子の統一言語モデルである。
MolXPT は MoleculeNet 上での分子特性予測の強いベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-18T03:58:19Z) - Multi-modal Molecule Structure-text Model for Text-based Retrieval and
Editing [107.49804059269212]
分子の化学構造とテキスト記述を共同で学習し, マルチモーダルな分子構造テキストモデル, MoleculeSTMを提案する。
実験において、分子STMは、新しい生化学的概念を創出するための最先端の一般化能力を得る。
論文 参考訳(メタデータ) (2022-12-21T06:18:31Z) - Fine-Grained Chemical Entity Typing with Multimodal Knowledge
Representation [36.6963949360594]
核となる化学文献から化学反応に関する詳細な知識を抽出する方法は、新たな課題である。
本稿では, 微細な化学エンティティタイピングの問題を解決するために, マルチモーダル表現学習フレームワークを提案する。
実験の結果,提案手法は複数の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-29T19:41:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。