論文の概要: MolAct: An Agentic RL Framework for Molecular Editing and Property Optimization
- arxiv url: http://arxiv.org/abs/2512.20135v2
- Date: Wed, 24 Dec 2025 02:19:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 13:34:31.95478
- Title: MolAct: An Agentic RL Framework for Molecular Editing and Property Optimization
- Title(参考訳): MolAct: 分子編集とプロパティ最適化のためのエージェントRLフレームワーク
- Authors: Zhuo Yang, Yeyun Chen, Jiaqing Xie, Ben Gao, Shuaike Shen, Wanhao Liu, Liujia Yang, Beilun Wang, Tianfan Fu, Yuqiang Li,
- Abstract要約: 分子設計問題に対するエージェント強化学習フレームワークである MolAct を紹介する。
分子編集タスクの MolEditAgent と分子最適化タスクの MolOptAgent の2つのモデルファミリーを訓練するためのフレームワークをインスタンス化する。
その結果, 分子設計を多段階, ツール強化プロセスとして扱うことが, 信頼性と解釈性の向上の鍵であることが示唆された。
- 参考スコア(独自算出の注目度): 16.402871404193576
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular editing and optimization are multi-step problems that require iteratively improving properties while keeping molecules chemically valid and structurally similar. We frame both tasks as sequential, tool-guided decisions and introduce MolAct, an agentic reinforcement learning framework that employs a two-stage training paradigm: first building editing capability, then optimizing properties while reusing the learned editing behaviors. To the best of our knowledge, this is the first work to formalize molecular design as an Agentic Reinforcement Learning problem, where an LLM agent learns to interleave reasoning, tool-use, and molecular optimization. The framework enables agents to interact in multiple turns, invoking chemical tools for validity checking, property assessment, and similarity control, and leverages their feedback to refine subsequent edits. We instantiate the MolAct framework to train two model families: MolEditAgent for molecular editing tasks and MolOptAgent for molecular optimization tasks. In molecular editing, MolEditAgent-7B delivers 100, 95, and 98 valid add, delete, and substitute edits, outperforming strong closed "thinking" baselines such as DeepSeek-R1; MolEditAgent-3B approaches the performance of much larger open "thinking" models like Qwen3-32B-think. In molecular optimization, MolOptAgent-7B (trained on MolEditAgent-7B) surpasses the best closed "thinking" baseline (e.g., Claude 3.7) on LogP and remains competitive on solubility, while maintaining balanced performance across other objectives. These results highlight that treating molecular design as a multi-step, tool-augmented process is key to reliable and interpretable improvements.
- Abstract(参考訳): 分子編集と最適化は、化学的に有効で構造的に類似した分子を維持しながら、特性を反復的に改善する必要がある多段階の問題である。
いずれのタスクもシーケンシャルでツール指向の意思決定として扱うとともに,2段階のトレーニングパラダイムを取り入れたエージェント強化学習フレームワークであるMolActを導入しています。
我々の知る限りでは、LLMエージェントが推論、ツールユース、分子最適化を学習するエージェント強化学習問題として分子設計を形式化する最初の試みである。
このフレームワークは、エージェントが複数のターンで対話し、妥当性確認、プロパティアセスメント、類似性制御のための化学ツールを呼び出し、フィードバックを活用してその後の編集を洗練させる。
分子編集タスクは MolEditAgent 、分子最適化タスクは MolOptAgent である。
分子編集において、MolEditAgent-7Bは100、95、98個の有効な追加、削除、置換の編集を行い、DeepSeek-R1のような強力なクローズドな"思考"ベースラインよりも優れており、MolEditAgent-3BはQwen3-32Bのようなより大きなオープンな"思考"モデルの性能にアプローチしている。
分子最適化において、MoroptAgent-7B(MoroEditAgent-7B)はLogP上の最も閉じた「考える」ベースライン(例えばClaude 3.7)を超え、溶解度に競争力を持ちながら、他の目的に対してバランスの取れた性能を維持している。
これらの結果から, 分子設計を多段階, ツール拡張プロセスとして扱うことが, 信頼性と解釈性の向上の鍵であることが示唆された。
関連論文リスト
- MolEdit: Knowledge Editing for Multimodal Molecule Language Models [57.85765246726558]
MolEditは分子対カプセル生成とキャプション対分子生成のためのフレームワークである。
MolEditにはMulti-Expert Knowledge Adapterが組み込まれており、異なる分子ファセットの専門の専門家に、Expertise-Aware Editing Switcherで編集をルーティングする。
MolEditは信頼性を最大18.8%向上し、効率を保ちながらベースラインよりも12.0%良いローカリティを提供する。
論文 参考訳(メタデータ) (2025-11-16T20:48:37Z) - Coder as Editor: Code-driven Interpretable Molecular Optimization [36.84386817559159]
私たちは、編集アクションを実行可能なコードに変換することによって、推論と実行をブリッジするフレームワークMECoを紹介します。
提案手法は,化学反応とターゲット特異的化合物対からのリアルな編集を再現する際の精度を98%以上向上させる。
論文 参考訳(メタデータ) (2025-10-16T08:55:06Z) - An Auditable Agent Platform For Automated Molecular Optimisation [0.0]
薬物発見は、データ、専門知識、ツールが散在すると、しばしば勢いを失う。
このループを短くするため、分子最適化を自動化するエージェントフレームワークを使用した階層的なツールを構築しました。
論文 参考訳(メタデータ) (2025-08-05T13:41:32Z) - MT-Mol:Multi Agent System with Tool-based Reasoning for Molecular Optimization [13.94416046565452]
大規模言語モデル(LLM)を用いた分子最適化のためのマルチエージェントフレームワークMT-Molを紹介する。
本システムには, 構造記述子, 電子的およびトポロジ的特徴, フラグメントベース機能群, 分子的表現, 諸化学的性質の5つの異なる領域に分類された総合RDKitツールが組み込まれている。
MT-Molは、分析エージェント、分子生成科学者、推論出力検証器、レビュアーエージェントとの相互作用を通じて、ツール整列および段階的に推論された分子を生成する。
論文 参考訳(メタデータ) (2025-05-27T07:27:30Z) - MolEditRL: Structure-Preserving Molecular Editing via Discrete Diffusion and Reinforcement Learning [4.430115182041077]
MolEditRLは、構造的制約と正確なプロパティ最適化を統合する分子編集フレームワークである。
包括的評価のために,最大かつ最も特性に富んだ分子編集データセットである MolEdit-Instruct を構築した。
論文 参考訳(メタデータ) (2025-05-26T15:29:08Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z) - Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective [53.300288393173204]
大規模言語モデル(LLM)は、様々なクロスモーダルタスクにおいて顕著なパフォーマンスを示している。
本研究では,分子カプセル翻訳のためのインコンテキストFew-Shot Molecule Learningパラダイムを提案する。
分子理解とテキストベースの分子生成を含む分子キャプション翻訳におけるMollReGPTの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-11T08:16:25Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。