論文の概要: ReacLLaMA: Merging chemical and textual information in chemical
reactivity AI models
- arxiv url: http://arxiv.org/abs/2401.17267v1
- Date: Tue, 30 Jan 2024 18:57:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 13:44:04.359535
- Title: ReacLLaMA: Merging chemical and textual information in chemical
reactivity AI models
- Title(参考訳): ReacLLaMA: 化学反応性AIモデルにおける化学情報とテキスト情報の融合
- Authors: Aline Hartgers, Ramil Nugmanov, Kostiantyn Chernichenko, Joerg Kurt
Wegner
- Abstract要約: 化学反応性モデルは、分類(success/failure)や回帰(product yield)タスクの形式で化学反応の結果を予測するために開発されている。
報告されたモデルの大半は、反応剤、生成物、試薬、溶媒などの化学情報のみに基づいて訓練されている。
ここでは、Graphormerの反応性モデルを強化し、その精度を向上させることを目的とした手続きテキストの組み入れについて述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Chemical reactivity models are developed to predict chemical reaction
outcomes in the form of classification (success/failure) or regression (product
yield) tasks. The vast majority of the reported models are trained solely on
chemical information such as reactants, products, reagents, and solvents, but
not on the details of a synthetic protocol. Herein incorporation of procedural
text with the aim to augment the Graphormer reactivity model and improve its
accuracy is presented. Two major approaches are used: training an adapter
Graphormer model that is provided with a GPT-2-derived latent representation of
the text procedure (ReacLLaMA-Adapter) and labeling an unlabeled part of a
dataset with the LLaMA 2 model followed by training the Graphormer on an
extended dataset (Zero-Shot Labeling ReacLLaMA). Both methodologies enhance the
discernment of unpromising reactions, thereby providing more accurate models
with improved specificity.
- Abstract(参考訳): 化学反応性モデルは、分類(成功/失敗)や回帰(製品収量)という形で化学反応の結果を予測するために開発された。
報告されたモデルの大部分は、反応物質、生成物、試薬、溶媒などの化学情報のみに基づいて訓練されているが、合成プロトコルの詳細には触れていない。
本稿では,graphormerの反応性モデルを強化し,精度を向上させることを目的とした手続きテキストの組み込みについて述べる。
GPT-2から派生したテキストプロシージャ(ReacLLaMA-Adapter)の潜在表現を備えたアダプタGraphormerモデルをトレーニングし、LLaMA 2モデルでデータセットのラベルのない部分をラベル付けし、拡張データセット(Zero-Shot Labeling ReacLLaMA)でGraphormerをトレーニングする。
どちらの手法も未熟な反応の識別を高め、特異性を改善したより正確なモデルを提供する。
関連論文リスト
- ScholarChemQA: Unveiling the Power of Language Models in Chemical Research Question Answering [54.80411755871931]
質問回答(QA)は、言語モデルの推論と知識の深さを効果的に評価する。
化学QAは、複雑な化学情報を理解しやすい形式に効果的に翻訳することで、教育と研究の両方において重要な役割を担っている。
このデータセットは、不均衡なデータ分散や、潜在的に有用である可能性のあるかなりの量の未ラベルデータを含む、典型的な現実世界の課題を反映している。
収集したデータを完全に活用して,化学的な問題に効果的に答えるQAMatchモデルを提案する。
論文 参考訳(メタデータ) (2024-07-24T01:46:55Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Meaningful machine learning models and machine-learned pharmacophores
from fragment screening campaigns [0.0]
機械学習モデルは50以上のフラグメントスクリーニングキャンペーンから派生しています。
MLモデルがバインドを成功させる上で重要であると考えるものについて、物理的に解釈可能で検証可能な表現を提供する。
MLモデルが提案する重要な分子構造と,手動で割り当てた分子構造との間には,よく一致している。
論文 参考訳(メタデータ) (2022-03-25T18:08:55Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Rxn Hypergraph: a Hypergraph Attention Model for Chemical Reaction
Representation [70.97737157902947]
現在、化学反応を強固に表現するための普遍的で広く採用されている方法は存在しない。
ここでは、グラフに基づく分子構造の表現を利用して、ハイパーグラフアテンションニューラルネットワークアプローチを開発し、テストする。
我々はこのハイパーグラフ表現を3つの独立な化学反応データセットを用いて3つの実験で評価した。
論文 参考訳(メタデータ) (2022-01-02T12:33:10Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Data Transfer Approaches to Improve Seq-to-Seq Retrosynthesis [1.6449390849183363]
再合成は、化学反応によって与えられた生成物化合物を合成するために反応化合物を推測する問題である。
レトロ合成に関する最近の研究は、より洗練された予測モデルの提案に焦点を当てている。
モデルをフィードするデータセットは、最高の一般化モデルを達成する上でも重要な役割を果たす。
論文 参考訳(メタデータ) (2020-10-02T05:27:51Z) - Retrosynthesis Prediction with Conditional Graph Logic Network [118.70437805407728]
コンピュータ支援のレトロシンセシスは、化学と計算機科学の双方から新たな関心を集めている。
本稿では,グラフニューラルネットワーク上に構築された条件付きグラフィカルモデルであるConditional Graph Logic Networkを用いて,この課題に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-06T05:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。