論文の概要: ChemAgent: Enhancing LLMs for Chemistry and Materials Science through Tree-Search Based Tool Learning
- arxiv url: http://arxiv.org/abs/2506.07551v1
- Date: Mon, 09 Jun 2025 08:41:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.869982
- Title: ChemAgent: Enhancing LLMs for Chemistry and Materials Science through Tree-Search Based Tool Learning
- Title(参考訳): ChemAgent:木探索ツール学習による化学・材料科学のためのLLMの強化
- Authors: Mengsong Wu, YaFei Wang, Yidong Ming, Yuqi An, Yuwei Wan, Wenliang Chen, Binbin Lin, Yuqiang Li, Tong Xie, Dongzhan Zhou,
- Abstract要約: 大規模言語モデル(LLM)は、最近化学タスクにおいて有望な能力を実証した。
本稿では,基本的な情報検索から複雑な反応予測まで,137種類の外部化学ツールを統合したLCMエージェントを提案する。
- 参考スコア(独自算出の注目度): 12.745398618084474
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have recently demonstrated promising capabilities in chemistry tasks while still facing challenges due to outdated pretraining knowledge and the difficulty of incorporating specialized chemical expertise. To address these issues, we propose an LLM-based agent that synergistically integrates 137 external chemical tools created ranging from basic information retrieval to complex reaction predictions, and a dataset curation pipeline to generate the dataset ChemToolBench that facilitates both effective tool selection and precise parameter filling during fine-tuning and evaluation. We introduce a Hierarchical Evolutionary Monte Carlo Tree Search (HE-MCTS) framework, enabling independent optimization of tool planning and execution. By leveraging self-generated data, our approach supports step-level fine-tuning (FT) of the policy model and training task-adaptive PRM and ORM that surpass GPT-4o. Experimental evaluations demonstrate that our approach significantly improves performance in Chemistry QA and discovery tasks, offering a robust solution to integrate specialized tools with LLMs for advanced chemical applications. All datasets and code are available at https://github.com/AI4Chem/ChemistryAgent .
- Abstract(参考訳): 大規模言語モデル(LLM)は、最近化学タスクにおいて有望な能力を示したが、未熟な事前学習の知識と専門的な化学知識を取り入れることの難しさにより、まだ課題に直面している。
これらの問題に対処するために,基本的な情報検索から複雑な反応予測まで137種類の外部化学ツールを相乗的に統合するLCMエージェントと,微調整および評価の際の効果的なツール選択と正確なパラメータフィリングを容易にするデータセットChemToolBenchを生成するデータセットキュレーションパイプラインを提案する。
階層的進化的モンテカルロ木探索(HE-MCTS)フレームワークを導入し,ツール計画と実行の独立最適化を実現する。
自己生成データを活用することで、ポリシーモデルの段階的な微調整(FT)と、GPT-4oを超えるタスク適応型PRMとORMの訓練を支援する。
実験により,本手法は化学QAおよび発見タスクの性能を著しく向上させ,高度な化学応用のための特殊なツールをLCMに統合する堅牢なソリューションを提供することを示した。
すべてのデータセットとコードはhttps://github.com/AI4Chem/ChemistryAgent.orgで公開されている。
関連論文リスト
- ChemHAS: Hierarchical Agent Stacking for Enhancing Chemistry Tools [13.4380618947395]
我々は,限られたデータからエージェントスタック構造を最適化することで,化学ツールを強化するシンプルで効果的な方法であるChemHASを提案する。
ChemHASは4つの基本的な化学タスクにまたがって性能を向上し,ツールの予測誤差を効果的に補償できることを実証した。
論文 参考訳(メタデータ) (2025-05-27T06:22:57Z) - Distilling and exploiting quantitative insights from Large Language Models for enhanced Bayesian optimization of chemical reactions [0.0]
大規模言語モデル (LLM) は基礎学習データに存在する化学情報が化学データ処理に有効であることを示した。
本研究では, LLMからの化学情報を抽出し, 反応条件のBOを加速し, 収率を最大化するために移動学習に利用できることを示す。
論文 参考訳(メタデータ) (2025-04-11T12:45:07Z) - ChemAgent: Self-updating Library in Large Language Models Improves Chemical Reasoning [64.2106664137118]
ChemAgentは,大規模言語モデル(LLM)の性能向上を目的とした,新しいフレームワークである。
化学タスクをサブタスクに分解し、これらのサブタスクを将来のクエリに参照可能な構造化されたコレクションにコンパイルすることで開発される。
新しい問題を提示すると、ChemAgentは、私たちがメモリと呼ぶライブラリから関連する情報を検索し、精査する。
論文 参考訳(メタデータ) (2025-01-11T17:10:30Z) - Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning [71.2981957820888]
本稿では,データセット間のデータ品質向上を自動化する新しいStar-Agentsフレームワークを提案する。
このフレームワークは最初,複数のLDMエージェントを用いた多様なインストラクションデータを生成する。
生成したデータは、難易度と品質の両方を評価する二重モデル法を用いて厳密な評価を行う。
論文 参考訳(メタデータ) (2024-11-21T02:30:53Z) - A Review of Large Language Models and Autonomous Agents in Chemistry [0.7184549921674758]
大規模言語モデル(LLM)は化学において強力なツールとして登場した。
このレビューでは、化学におけるLCMの機能と、自動化による科学的発見を加速する可能性を強調している。
エージェントは新たなトピックであるので、化学以外のエージェントのレビューの範囲を広げます。
論文 参考訳(メタデータ) (2024-06-26T17:33:21Z) - An Autonomous Large Language Model Agent for Chemical Literature Data
Mining [60.85177362167166]
本稿では,幅広い化学文献から高忠実度抽出が可能なエンドツーエンドAIエージェントフレームワークを提案する。
本フレームワークの有効性は,反応条件データの精度,リコール,F1スコアを用いて評価する。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z) - Chemist-X: Large Language Model-empowered Agent for Reaction Condition Recommendation in Chemical Synthesis [55.30328162764292]
Chemist-Xは、化学合成における反応条件最適化(RCO)タスクを自動化する包括的なAIエージェントである。
このエージェントは、検索強化世代(RAG)技術とAI制御のウェットラブ実験を実行する。
我々の自動ウェットラブ実験の結果は、LLMが制御するエンドツーエンドの操作を、ロボットに人間がいない状態で行うことで達成され、Chemist-Xの自動運転実験における能力が証明された。
論文 参考訳(メタデータ) (2023-11-16T01:21:33Z) - ChemCrow: Augmenting large-language models with chemistry tools [0.9195187117013247]
大規模言語モデル(LLM)は、領域全体にわたるタスクにおいて高いパフォーマンスを示してきたが、化学に関連した問題に悩まされている。
本研究では, 有機合成, 創薬, 材料設計における課題を遂行するLLM化学剤であるChemCrowを紹介する。
我々のエージェントは、昆虫の忌避剤である3種の有機触媒の合成を自律的に計画し、実行し、新しいクロモフォアの発見を導いた。
論文 参考訳(メタデータ) (2023-04-11T17:41:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。