論文の概要: Modular Multi-Task Learning for Chemical Reaction Prediction
- arxiv url: http://arxiv.org/abs/2602.10404v1
- Date: Wed, 11 Feb 2026 01:17:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.362514
- Title: Modular Multi-Task Learning for Chemical Reaction Prediction
- Title(参考訳): 化学反応予測のためのモジュール型マルチタスク学習
- Authors: Jiayun Pang, Ahmed M. Zaitoun, Xacobe Couso Cambeiro, Ivan Vulić,
- Abstract要約: 低ランク適応(LoRA)は、有機反応予測のための完全な微調整に代わるパラメータ効率の代替である。
LoRAは完全な微調整に匹敵する精度を達成し、破滅的な忘れを効果的に軽減し、マルチタスク性能を向上する。
- 参考スコア(独自算出の注目度): 1.443416244644791
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting large language models (LLMs) trained on broad organic chemistry to smaller, domain-specific reaction datasets is a key challenge in chemical and pharmaceutical R&D. Effective specialisation requires learning new reaction knowledge while preserving general chemical understanding across related tasks. Here, we evaluate Low-Rank Adaptation (LoRA) as a parameter-efficient alternative to full fine-tuning for organic reaction prediction on limited, complex datasets. Using USPTO reaction classes and challenging C-H functionalisation reactions, we benchmark forward reaction prediction, retrosynthesis and reagent prediction. LoRA achieves accuracy comparable to full fine-tuning while effectively mitigating catastrophic forgetting and better preserving multi-task performance. Both fine-tuning approaches generalise beyond training distributions, producing plausible alternative solvent predictions. Notably, C-H functionalisation fine-tuning reveals that LoRA and full fine-tuning encode subtly different reactivity patterns, suggesting more effective reaction-specific adaptation with LoRA. As LLMs continue to scale, our results highlight the practicality of modular, parameter-efficient fine-tuning strategies for their flexible deployment for chemistry applications.
- Abstract(参考訳): 広い有機化学で訓練された大規模言語モデル(LLM)を、より小さく、ドメイン固有の反応データセットに適応させることは、化学と医薬品の研究開発において重要な課題である。
効果的な特殊化には、関連するタスク全体にわたって一般的な化学的理解を維持しながら、新しい反応知識を学習する必要がある。
そこで我々は,Low-Rank Adaptation (LoRA) を,限定された複雑なデータセット上での有機反応予測のための完全微調整の代替として評価する。
USPTO反応クラスとC-H関数化反応の挑戦を用いて, 前方反応予測, 逆合成, 試薬予測のベンチマークを行った。
LoRAは完全な微調整に匹敵する精度を達成し、壊滅的な忘れを効果的に軽減し、マルチタスク性能を向上する。
両方の微調整アプローチは、トレーニング分布を超えて一般化し、可算な代替溶媒予測を生成する。
特に、C-H官能化微細調整は、LoRAと完全微調整がサブティリーな反応性パターンをコードし、LoRAによるより効果的な反応特異的適応を示唆している。
LLMの規模が拡大するにつれて, 化学応用のための柔軟な展開のためのモジュラー, パラメータ効率のよい微調整戦略の実用性を強調した。
関連論文リスト
- Interpretable Deep Learning for Polar Mechanistic Reaction Prediction [43.95903801494905]
PMechRP(Polar Mechanistic Reaction Predictor)は,PMechDBデータセット上で機械学習モデルをトレーニングするシステムである。
私たちは、トランスフォーマーベース、グラフベース、および2段階のシアムアーキテクチャを含む、さまざまな機械学習モデルの比較をトレーニングします。
私たちの最高のパフォーマンスのアプローチはハイブリッドモデルで、5アンサンブルのChemformerモデルと2ステップのSiameseフレームワークを組み合わせたものです。
論文 参考訳(メタデータ) (2025-04-22T02:31:23Z) - Chemical knowledge-informed framework for privacy-aware retrosynthesis learning [72.39098405805318]
現在の機械学習に基づくレトロシンセシスは、複数のソースからの反応データを1つのエッジに集め、予測モデルを訓練する。
このパラダイムは、組織の境界を越えた広範なデータ可用性を必要とするため、かなりのプライバシーリスクをもたらす。
本研究では, 化学知識インフォームド・フレームワーク (CKIF) について紹介する。
論文 参考訳(メタデータ) (2025-02-26T13:13:24Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - log-RRIM: Yield Prediction via Local-to-global Reaction Representation Learning and Interaction Modeling [6.310759215182946]
log-RRIMは、化学反応の収量を予測するために設計された革新的なグラフトランスフォーマーベースのフレームワークである。
log-RRIMの重要な特徴は、試薬と反応中心の相互作用に焦点を当てたクロスアテンション機構の統合である。
Log-RRIMは、特に中~高収率反応において、我々の実験において優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-20T18:35:56Z) - Text-Augmented Multimodal LLMs for Chemical Reaction Condition Recommendation [38.76977853056086]
Chemma-RCは、タスク固有の対話と条件生成を通じて有効な条件を識別するテキスト拡張マルチモーダルLLMである。
Chemma-RCは、複数のモダリティ(テキストコーパス、反応SMILES、反応グラフを含む)を共有埋め込みモジュールで整列させることで、化学反応の統一的な表現を学習する。
データセットのパフォーマンスベンチマークは、最適な条件を特定する上で高い精度を示し、最先端の手法よりも最大17%改善した。
論文 参考訳(メタデータ) (2024-07-21T12:27:26Z) - Retrosynthesis prediction enhanced by in-silico reaction data
augmentation [66.5643280109899]
RetroWISEは,実データから推定されるベースモデルを用いて,シリコン内反応の生成と増大を行うフレームワークである。
3つのベンチマークデータセットで、RetroWISEは最先端モデルに対して最高の全体的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-01-31T07:40:37Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。