論文の概要: Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation
- arxiv url: http://arxiv.org/abs/2407.15141v2
- Date: Thu, 25 Sep 2025 04:37:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.431005
- Title: Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation
- Title(参考訳): 化学反応条件勧告のためのテキスト強化多モードLCM
- Authors: Yu Zhang, Ruijie Yu, Kaipeng Zeng, Ding Li, Feng Zhu, Xiaokang Yang, Yaohui Jin, Yanyan Xu,
- Abstract要約: Chemma-RCは、タスク固有の対話と条件生成を通じて有効な条件を識別するテキスト拡張マルチモーダルLLMである。
Chemma-RCは、複数のモダリティ(テキストコーパス、反応SMILES、反応グラフを含む)を共有埋め込みモジュールで整列させることで、化学反応の統一的な表現を学習する。
データセットのパフォーマンスベンチマークは、最適な条件を特定する上で高い精度を示し、最先端の手法よりも最大17%改善した。
- 参考スコア(独自算出の注目度): 38.76977853056086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying reaction conditions that are broadly applicable across diverse substrates is a longstanding challenge in chemical and pharmaceutical research. While many methods are available to generate conditions with acceptable performance, a universal approach for reliably discovering effective conditions during reaction exploration is rare. Consequently, current reaction optimization processes are often labor-intensive, time-consuming, and costly, relying heavily on trial-and-error experimentation. Nowadays, large language models (LLMs) are capable of tackling chemistry-related problems, such as molecule design and chemical reasoning tasks. Here, we report the design, implementation and application of Chemma-RC, a text-augmented multimodal LLM to identify effective conditions through task-specific dialogue and condition generation. Chemma-RC learns a unified representation of chemical reactions by aligning multiple modalities-including text corpus, reaction SMILES, and reaction graphs-within a shared embedding module. Performance benchmarking on datasets showed high precision in identifying optimal conditions, with up to 17% improvement over the current state-of-the-art methods. A palladium-catalysed imidazole C-H arylation reaction was investigated experimentally to evaluate the functionalities of the Chemma-RC in practice. Our findings suggest that Chemma-RC holds significant potential to accelerate high-throughput condition screening in chemical synthesis.
- Abstract(参考訳): 多様な基質に広く適用可能な反応条件の同定は、化学・薬学研究における長年にわたる課題である。
多くの方法は許容性能の条件を生成することができるが、反応探索中に有効条件を確実に発見するための普遍的なアプローチはまれである。
その結果、現在の反応最適化プロセスは、しばしば労働集約的で、時間がかかり、コストがかかり、試行錯誤の実験に大きく依存する。
今日では、大規模言語モデル(LLM)は、分子設計や化学推論タスクといった化学関連問題に取り組むことができる。
本稿では,Chemma-RCの設計,実装,適用について報告する。
Chemma-RCは、複数のモダリティ(テキストコーパス、反応SMILES、反応グラフを含む)を共有埋め込みモジュールで整列させることで、化学反応の統一的な表現を学習する。
データセットのパフォーマンスベンチマークは、最適な条件を特定する上で高い精度を示し、最先端の手法よりも最大17%改善した。
パラジウム触媒によるイミダゾールC-Hアリール化反応を実験的に検討し,実際にChemma-RCの機能評価を行った。
以上の結果から,Chemma-RCは化学合成における高出力条件スクリーニングの促進に有意な可能性を秘めていることが示唆された。
関連論文リスト
- ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - Enhancing Chemical Reaction and Retrosynthesis Prediction with Large Language Model and Dual-task Learning [8.402406301818905]
大規模言語モデル(LLM)は、多くの領域において可能性を示している。
ChemDualは正確な化学合成のための新しいフレームワークである。
ChemDualは反応の予測とレトロ合成の両方において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-05T13:31:36Z) - Towards Large-scale Chemical Reaction Image Parsing via a Multimodal Large Language Model [4.860497022313892]
化学反応画像を機械可読データに解析するために,反応画像マルチモーダル大言語モデル(RxnIM)を導入する。
RxnIMは反応画像から重要な化学成分を抽出し、反応条件を記述したテキスト内容を解釈する。
提案手法は,各種ベンチマークでF1スコアが平均88%,文献手法が5%を超え,優れた性能を実現している。
論文 参考訳(メタデータ) (2025-03-11T08:11:23Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
本稿では,様々な有機反応関連タスクに適した新しい化学反応表現学習モデルであるモデルネームを紹介する。
反応物質と生成物との原子対応を統合することにより、反応中に生じる分子変換を識別し、反応機構の理解を深める。
反応条件を化学反応表現に組み込むアダプタ構造を設計し、様々な反応条件を処理し、様々なデータセットや下流タスク、例えば反応性能予測に適応できるようにした。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - log-RRIM: Yield Prediction via Local-to-global Reaction Representation Learning and Interaction Modeling [6.310759215182946]
log-RRIMは、化学反応の収量を予測するために設計された革新的なグラフトランスフォーマーベースのフレームワークである。
本手法は,一意の局所的-グローバル的反応表現学習戦略を実装している。
反応剤-試薬相互作用の高度なモデリングと小さな分子断片への感受性により、化学合成における反応計画と最適化のための貴重なツールとなる。
論文 参考訳(メタデータ) (2024-10-20T18:35:56Z) - ChemEval: A Comprehensive Multi-Level Chemical Evaluation for Large Language Models [62.37850540570268]
この領域の既存のベンチマークは、化学研究専門家の特定の要求を適切に満たさない。
ChemEvalは化学の4つの重要な進歩レベルを特定し、42の異なる化学タスクで12次元のLCMを評価する。
その結果, LLMは文献の理解と指導に優れる一方で, 高度な化学知識を必要とするタスクでは不足していることがわかった。
論文 参考訳(メタデータ) (2024-09-21T02:50:43Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [57.70772230913099]
Chemist-Xは、検索増強生成(RAG)技術を用いた化学合成において、反応条件レコメンデーション(RCR)タスクを自動化する。
Chemist-Xはオンラインの分子データベースを尋問し、最新の文献データベースから重要なデータを蒸留する。
Chemist-Xは化学者の作業量を大幅に減らし、より根本的で創造的な問題に集中できるようにする。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - ReLM: Leveraging Language Models for Enhanced Chemical Reaction
Prediction [26.342666819515774]
ReLMは、言語モデル(LM)に符号化された化学知識を活用してグラフニューラルネットワーク(GNN)を支援するフレームワークである。
実験結果から,ReLMは各種化学反応データセットにおける最先端GNN法の性能向上を実証した。
論文 参考訳(メタデータ) (2023-10-20T15:33:23Z) - Root-aligned SMILES for Molecular Retrosynthesis Prediction [31.818364437526885]
再合成予測は有機合成の基本的な問題であり、標的分子の合成に使用できる前駆体分子を発見することが目的である。
既存の計算逆合成手法の一般的なパラダイムは、列から列への変換問題として再合成予測を定式化する。
本稿では,製品と反応するSMILES間の一対一マッピングを厳密に整列するルート整列SMILES(R-SMILES)を提案する。
論文 参考訳(メタデータ) (2022-03-22T03:50:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。