論文の概要: Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis
- arxiv url: http://arxiv.org/abs/2601.17687v1
- Date: Sun, 25 Jan 2026 04:23:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.212101
- Title: Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis
- Title(参考訳): エージェント強化学習は分子設計と合成のための次世代化学言語モデルを促進する
- Authors: Hao Li, He Cao, Shenyao Peng, Zijing Liu, Bin Feng, Yu Wang, Zhiyuan Yan, Yonghong Tian, Yu Li, Li Yuan,
- Abstract要約: ChemCRAFTは、化学推論を知識記憶から切り離すために、エージェント強化学習を活用する新しいフレームワークである。
ChemCRAFTは最小の推論コストで優れたパフォーマンスを実現する。
この研究は、AI支援化学の費用対効果とプライバシー保護のパラダイムを確立し、局所的なデプロイ可能なエージェントによる分子発見を加速するための新たな道を開く。
- 参考スコア(独自算出の注目度): 51.83339196548892
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Language models are revolutionizing the biochemistry domain, assisting scientists in drug design and chemical synthesis with high efficiency. Yet current approaches struggle between small language models prone to hallucination and limited knowledge retention, and large cloud-based language models plagued by privacy risks and high inference costs. To bridge this gap, we introduce ChemCRAFT, a novel framework leveraging agentic reinforcement learning to decouple chemical reasoning from knowledge storage. Instead of forcing the model to memorize vast chemical data, our approach empowers the language model to interact with a sandbox for precise information retrieval. This externalization of knowledge allows a locally deployable small model to achieve superior performance with minimal inference costs. To enable small language models for agent-calling ability, we build an agentic trajectory construction pipeline and a comprehensive chemical-agent sandbox. Based on sandbox interactions, we constructed ChemToolDataset, the first large-scale chemical tool trajectory dataset. Simultaneously, we propose SMILES-GRPO to build a dense chemical reward function, promoting the model's ability to call chemical agents. Evaluations across diverse aspects of drug design show that ChemCRAFT outperforms current cloud-based LLMs in molecular structure analysis, molecular optimization, and synthesis pathway prediction, demonstrating that scientific reasoning is not solely an emergent ability of model scale, but a learnable policy of tool orchestration. This work establishes a cost-effective and privacy-preserving paradigm for AI-aided chemistry, opening new avenues for accelerating molecular discovery with locally deployable agents.
- Abstract(参考訳): 言語モデルは生物化学領域に革命をもたらし、科学者が医薬品の設計と化学合成を高効率で支援している。
しかし、現在のアプローチでは、幻覚や知識の保持が制限される傾向にある小さな言語モデルと、プライバシのリスクと高い推論コストに悩まされる大規模なクラウドベースの言語モデルの間で苦労している。
このギャップを埋めるために,エージェント強化学習を利用した新しいフレームワークであるChemCRAFTを導入する。
膨大な化学データを記憶させる代わりに、我々のアプローチは言語モデルに対して、正確な情報検索のためにサンドボックスと対話する権限を与える。
この知識の外部化により、ローカルにデプロイ可能な小さなモデルは、最小の推論コストで優れたパフォーマンスを達成することができる。
エージェント呼び出し機能のための小さな言語モデルを実現するため,エージェント軌道構築パイプラインと包括的化学エージェントサンドボックスを構築した。
サンドボックスインタラクションに基づいて,最初の大規模化学ツールトラジェクトリデータセットであるChemToolDatasetを構築した。
同時に, SMILES-GRPOによる高密度化学報酬関数の構築を提案し, モデルが化学物質を呼ぶ能力を促進する。
ChemCRAFTは、分子構造解析、分子最適化、合成経路予測において、現在のクラウドベースのLLMよりも優れており、科学的推論は単にモデルスケールの創発的な能力であるだけでなく、ツールオーケストレーションの学習可能なポリシーであることを実証している。
この研究は、AI支援化学の費用対効果とプライバシー保護のパラダイムを確立し、局所的なデプロイ可能なエージェントによる分子発見を加速するための新たな道を開く。
関連論文リスト
- Unveiling Latent Knowledge in Chemistry Language Models through Sparse Autoencoders [42.033443425253644]
我々はスパースオートエンコーダ技術を拡張して化学言語モデル内の解釈可能な特徴を明らかにし,検討する。
以上の結果から,これらのモデルが化学概念の豊かな風景をエンコードしていることが判明した。
我々のアプローチは、化学にフォーカスしたAIシステムにおける潜在知識を明らかにするための一般的なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-12-08T22:20:01Z) - Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。
我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文 参考訳(メタデータ) (2025-10-20T17:56:01Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - MolProphecy: Bridging Medicinal Chemists' Knowledge and Molecular Pre-Trained Models via a Multi-Modal Framework [21.677162643535826]
MolProphecyは、化学者のドメイン知識を分子特性予測モデルに統合するためのフレームワークである。
ChatGPTは、専門家レベルの推論と意思決定をシミュレートする仮想化学者である。
MolProphecyは4つのベンチマークデータセットで、最先端(SOTA)モデルより優れています。
論文 参考訳(メタデータ) (2025-06-26T12:51:59Z) - Leveraging Chemistry Foundation Models to Facilitate Structure Focused Retrieval Augmented Generation in Multi-Agent Workflows for Catalyst and Materials Design [0.0]
ケミカル基礎モデルは,構造に着目したセマンティックケミカル情報検索の基盤として機能することを示す。
また,OpenCLIP などのマルチモーダルモデルと化学基礎モデルの併用について述べる。
論文 参考訳(メタデータ) (2024-08-21T17:25:45Z) - ChemLLM: A Chemical Large Language Model [49.308528569982805]
大規模言語モデル(LLM)は化学応用において顕著な進歩を遂げた。
しかし、コミュニティには化学に特化したLLMが欠落している。
本稿では,化学に特化した最初のLLMを特徴とする包括的フレームワークであるChemLLMを紹介する。
論文 参考訳(メタデータ) (2024-02-10T01:11:59Z) - Language models in molecular discovery [2.874893537471256]
科学的言語モデル」は、小さな分子、タンパク質、またはポリマーで機能する。
化学において、言語モデルは分子発見サイクルの加速に寄与する。
我々は、貴重なオープンソースソフトウェア資産を強調し、科学言語モデリングの分野への参入障壁を低くする。
論文 参考訳(メタデータ) (2023-09-28T08:19:54Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。